tsu-nera’s gists

tsu-nera / balancer.py

Created June 27, 2017 13:07

Q-LearningでGyroBoyの立ち上げ

	import numpy as np
	import ev3dev.ev3 as ev3

	import random, os, time
	import pickle


	# qlearningAgents.py
	# ------------------
	## based on http://inst.eecs.berkeley.edu/~cs188/sp09/pacman.html

tsu-nera / cartpole_qlearning.py

Last active June 26, 2017 12:54

CartPole-v0 Q-Learning https://gym.openai.com/evaluations/eval_XduLYAihRHyfU3R2t5dR2Q

	import gym
	import numpy as np
	from qlearning_answer import QLearningAgent

	env = gym.make("CartPole-v0")
	n_actions = env.action_space.n

	def build_state(features):
	"""get our features and put all together converting into an integer"""
	return int("".join(map(lambda feature: str(int(feature)), features)))

tsu-nera / q_tic_tac_toe.py

Last active June 22, 2017 21:59

Q学習法

tsu-nera / cem.py

Created June 19, 2017 10:58

	import numpy as np
	import gym
	from gym.spaces import Discrete, Box

	# ================================================================
	# Policies
	# ================================================================

	class DeterministicDiscreteActionLinearPolicy(object):

tsu-nera / gradient_descent.ipynb

Created June 18, 2017 06:54

Gradient Descent

Sorry, something went wrong. Reload?

Sorry, we cannot display this file.

Sorry, this file is invalid so it cannot be displayed.

tsu-nera / mc_tic_tac_toe.py

Created June 14, 2017 10:55

モンテカルロ法でtic-tac-toe

	import gym
	import numpy as np
	import gym_tic_tac_toe
	import random
	from math import floor
	import matplotlib.pyplot as plt

	def random_plus_middle_move(moves, p):
	if ([p, 4] in moves):
	m = [p, 4]

tsu-nera / frozenlake8x8_v0_ga.py

Created June 10, 2017 05:38

OpenAI Gym FrozenLake8x8 GA https://gym.openai.com/evaluations/eval_ttOXKJkCRJmS34oZCJNhrw

	import gym
	import numpy as np
	from gym import wrappers

	env = gym.make("FrozenLake8x8-v0")
	env = wrappers.Monitor(env, '/tmp/frozenlake-experiment-2')
	env.reset()
	n_states = env.observation_space.n
	n_actions = env.action_space.n

tsu-nera / frozenlake_v0_ga_deap.py

Created June 9, 2017 22:30

OpenAI Gym FrozenLake-v0 GA with deap https://gym.openai.com/evaluations/eval_uU3CIG5yTgOhOXVM8EG3wA

	import gym
	import numpy as np
	from gym import wrappers

	env = gym.make("FrozenLake-v0")
	env = wrappers.Monitor(env, '/tmp/cartpole-experiment-5')

	env.reset();
	n_states = env.observation_space.n
	n_actions = env.action_space.n

tsu-nera / frozenlake_v0_ga.py

Last active June 9, 2017 18:48

OpenAI Gym FrozenLake-v0 GA https://gym.openai.com/evaluations/eval_YpHI9YmhQoSGcKMI1dFsw

	import gym
	import numpy as np
	from gym import wrappers

	env = gym.make("FrozenLake-v0")
	env = wrappers.Monitor(env, '/tmp/cartpole-experiment-3')

	env.reset();
	n_states = env.observation_space.n
	n_actions = env.action_space.n

tsu-nera / frozenlake_v0_random.py

Last active June 9, 2017 18:49

OpenAI Gym FrozenLake-v0 random search https://gym.openai.com/evaluations/eval_iinFj8fUSvOOYHWXwjjAw

	import gym
	import numpy as np
	from gym import wrappers

	env = gym.make("FrozenLake-v0")
	env = wrappers.Monitor(env, '/tmp/cartpole-experiment-2')

	env.reset();
	n_states = env.observation_space.n
	n_actions = env.action_space.n

Tsunemichi Harada tsu-nera