Address comments

mrshenli · mrshenli · commit 08acbc3be15d · 2020-01-10T15:04:20.000-08:00
diff --git a/intermediate_source/rpc_tutorial.rst b/intermediate_source/rpc_tutorial.rst
@@ -125,9 +125,21 @@ simple and the two steps explicit in this example.
 
 .. code:: python
 
+    import argparse
     import gym
     import torch.distributed.rpc as rpc
 
+    parser = argparse.ArgumentParser(
+        description="RPC Reinforcement Learning Example",
+        formatter_class=argparse.ArgumentDefaultsHelpFormatter,
+    )
+
+    parser.add_argument('--world_size', default=2, help='Number of workers')
+    parser.add_argument('--log_interval', default=1, help='Log every log_interval episodes')
+    parser.add_argument('--gamma', default=0.1, help='how much to value future rewards')
+    parser.add_argument('--seed', default=1, help='random seed for reproducibility')
+    args = parser.parse_args()
+
     class Observer:
 
         def __init__(self):
@@ -231,6 +243,7 @@ contain the recorded action probs and rewards.
     class Agent:
         ...
         def run_episode(self, n_steps=0):
+            futs = []
             for ob_rref in self.ob_rrefs:
                 # make async RPC to kick off an episode on all observers
                 futs.append(
@@ -310,6 +323,10 @@ available in the `API page <https://pytorch.org/docs/master/rpc.html>`__.
 
     import torch.multiprocessing as mp
 
+    AGENT_NAME = "agent"
+    OBSERVER_NAME="obs"
+    TOTAL_EPISODE_STEP = 100
+
     def run_worker(rank, world_size):
         os.environ['MASTER_ADDR'] = 'localhost'
         os.environ['MASTER_PORT'] = '29500'