Nikola Živković NMZivkovic

Freedom. Wisdom. Exellence.

NMZivkovic / dq_agent_constructor.py

Created July 7, 2019 11:59

	def __init__(self, enviroment, optimizer):
	# Initialize atributes
	self._state_size = enviroment.observation_space.n
	self._action_size = enviroment.action_space.n
	self._optimizer = optimizer

	self.expirience_replay = deque(maxlen=2000)

	# Initialize discount and exploration rate
	self.gamma = 0.6

NMZivkovic / dq_agent.py

Created July 7, 2019 11:56

	class Agent:
	def __init__(self, enviroment, optimizer):

	# Initialize atributes
	self._state_size = enviroment.observation_space.n
	self._action_size = enviroment.action_space.n
	self._optimizer = optimizer

	self.expirience_replay = deque(maxlen=2000)

NMZivkovic / dq_make_enviroment.py

Created July 7, 2019 11:51

	enviroment = gym.make("Taxi-v2").env
	enviroment.render()

	print('Number of states: {}'.format(enviroment.observation_space.n))
	print('Number of actions: {}'.format(enviroment.action_space.n))

NMZivkovic / dq_improt.py

Created July 7, 2019 11:46

	import numpy as np
	import random
	from IPython.display import clear_output
	from collections import deque
	import progressbar

	import gym

	from tensorflow.keras import Model, Sequential
	from tensorflow.keras.layers import Dense, Embedding, Reshape

NMZivkovic / evaluation.py

Created June 23, 2019 17:24

NMZivkovic / training.py

Created June 23, 2019 17:16

	num_of_episodes = 100000

	for episode in range(0, num_of_episodes):
	# Reset the enviroment
	state = enviroment.reset()

	# Initialize variables
	reward = 0
	terminated = False

NMZivkovic / initialize.py

Created June 23, 2019 17:14

	alpha = 0.1
	gamma = 0.6
	epsilon = 0.1
	q_table = np.zeros([enviroment.observation_space.n, enviroment.action_space.n])

NMZivkovic / create_enviroment.py

Created June 23, 2019 17:04

	enviroment = gym.make("Taxi-v2").env
	enviroment.render()

	print('Number of states: {}'.format(enviroment.observation_space.n))
	print('Number of actions: {}'.format(enviroment.action_space.n))

NMZivkovic / import.py

Created June 23, 2019 16:49

	import numpy as np
	import random
	from IPython.display import clear_output
	import gym

NMZivkovic / correlation.py

Created May 31, 2019 14:21

	corrMatt = data.corr()
	mask = np.array(corrMatt)
	mask[np.tril_indices_from(mask)] = False
	fig,ax= plt.subplots()
	fig.set_size_inches(20,10)
	sb.heatmap(corrMatt, cmap="Greens", mask=mask,vmax=.8, square=True,annot=True)