bamos · April 7, 2018 19:17 · CesMak · May 24, 2020
diff --git a/gym-subproc-example.py b/gym-subproc-example.py
 #!/usr/bin/env python3

 import numpy as np
 import gym
 from baselines.common.vec_env.subproc_vec_env import SubprocVecEnv

 env_name = 'Pendulum-v0'
 nproc = 8
 T = 10

 def make_env(env_id, seed):
    def _f():
        env = gym.make(env_id)
        env.seed(seed)
        return env
    return _f

 envs = [make_env(env_name, seed) for seed in range(nproc)]
 envs = SubprocVecEnv(envs)

 xt = envs.reset()
 for t in range(T):
    ut = np.stack([envs.action_space.sample() for _ in range(nproc)])
    xtp1, rt, done, info = envs.step(ut)
	#!/usr/bin/env python3

	import numpy as np
	import gym
	from baselines.common.vec_env.subproc_vec_env import SubprocVecEnv

	env_name = 'Pendulum-v0'
	nproc = 8
	T = 10

	def make_env(env_id, seed):
	def _f():
	env = gym.make(env_id)
	env.seed(seed)
	return env
	return _f

	envs = [make_env(env_name, seed) for seed in range(nproc)]
	envs = SubprocVecEnv(envs)

	xt = envs.reset()
	for t in range(T):
	ut = np.stack([envs.action_space.sample() for _ in range(nproc)])
	xtp1, rt, done, info = envs.step(ut)