adesgautam · July 8, 2018 14:04
diff --git a/frozen-lake_q-learning_test.py b/frozen-lake_q-learning_test.py

 import gym
 import numpy as np
 import time
 import pickle, os

 env = gym.make('FrozenLake-v0')

 with open("frozenLake_qTable.pkl", 'rb') as f:
 	Q = pickle.load(f)

 def choose_action(state):
 	action = np.argmax(Q[state, :])
 	return action

 # start
 for episode in range(5):

 	state = env.reset()
 	print("*** Episode: ", episode)
 	t = 0
 	while t < 100:
 		env.render()

 		action = choose_action(state)  
 		
 		state2, reward, done, info = env.step(action)  
 		
 		state = state2

 		if done:
 			break

 		time.sleep(0.5)
 		os.system('clear')

	import gym
	import numpy as np
	import time
	import pickle, os

	env = gym.make('FrozenLake-v0')

	with open("frozenLake_qTable.pkl", 'rb') as f:
	Q = pickle.load(f)

	def choose_action(state):
	action = np.argmax(Q[state, :])
	return action

	# start
	for episode in range(5):

	state = env.reset()
	print("*** Episode: ", episode)
	t = 0
	while t < 100:
	env.render()

	action = choose_action(state)

	state2, reward, done, info = env.step(action)

	state = state2

	if done:
	break

	time.sleep(0.5)
	os.system('clear')