sehugg · March 1, 2017 01:47
diff --git a/lstm_stateful_test.py b/lstm_stateful_test.py
 '''Test of stateful LSTM.

 This trains a LSTM to convert a frequency-modulated signal to a sine wave.
 The period of the signal is greater than the temporal dimension of the LSTM,
 so in theory the stateful version should have an advantage.
 '''
 from __future__ import print_function

 import os
 os.environ['KERAS_BACKEND'] = 'tensorflow'

 import numpy as np

 from keras.models import Sequential
 from keras.layers import Input, Dense, Dropout, Activation
 from keras.layers.recurrent import LSTM
 from keras.utils import np_utils
 from keras.callbacks import *
 import math
 import matplotlib.pyplot as plt
 import argparse

 parser = argparse.ArgumentParser()
 parser.add_argument('--stateful', dest='stateful', action='store_true')
 parser.add_argument('--seqlen', type=int, default=32)
 parser.add_argument('--epochs', type=int, default=100)
 parser.add_argument('--units', type=int, default=100)
 parser.add_argument('--freq', type=float, default=0.01)
 args = parser.parse_args()
 print(args)

 batch_size = seqlen = args.seqlen
 nb_epoch = args.epochs
 nb_units = args.units
 stateful = args.stateful

 freq = args.freq
 nsamples = seqlen*25
 ntest = seqlen*5

 def f(x):
  return math.sin(math.pi*2*(1*x+.9/(math.pi*2*freq)*(1-math.cos(math.pi*2*freq*x))))

 def make_sequences(seq, seqlen):
  result = []
  for i in range(0,len(seq)-seqlen):
    result.append(seq[i:i+seqlen])
  return np.array(result).reshape(-1,seqlen,1)
  
 X = np.array( [f(x) for x in range(0,nsamples)] )
 y = [math.sin(x*math.pi*2*freq) for x in range(0,nsamples-seqlen)]

 #plt.plot(X[0:300])
 #plt.plot(y[0:300])
 #plt.show()

 X = make_sequences(X, seqlen)

 X_test = X[-ntest:]
 y_test = y[-ntest:]
 X_train = X[0:-ntest]
 y_train = y[0:-ntest]

 model = Sequential()

 model.add(LSTM(nb_units, stateful=stateful, batch_input_shape=(batch_size,seqlen,1)))
 model.add(Dropout(0.2))
 #model.add(LSTM(nb_units, stateful=stateful))
 #model.add(Dropout(0.2))
 model.add(Dense(nb_units, activation='tanh'))
 model.add(Dense(1))

 model.compile(loss='mse', optimizer='adadelta')
              
 model.summary()
 print("Stateful = %r" % stateful)

 model.fit(X_train, y_train,
          batch_size=batch_size, nb_epoch=nb_epoch,
          shuffle=not stateful,
          callbacks=[EarlyStopping(monitor='val_loss', patience=3, verbose=0, mode='auto')],
          verbose=1, validation_data=(X_test, y_test))
	'''Test of stateful LSTM.

	This trains a LSTM to convert a frequency-modulated signal to a sine wave.
	The period of the signal is greater than the temporal dimension of the LSTM,
	so in theory the stateful version should have an advantage.
	'''
	from __future__ import print_function

	import os
	os.environ['KERAS_BACKEND'] = 'tensorflow'

	import numpy as np

	from keras.models import Sequential
	from keras.layers import Input, Dense, Dropout, Activation
	from keras.layers.recurrent import LSTM
	from keras.utils import np_utils
	from keras.callbacks import *
	import math
	import matplotlib.pyplot as plt
	import argparse

	parser = argparse.ArgumentParser()
	parser.add_argument('--stateful', dest='stateful', action='store_true')
	parser.add_argument('--seqlen', type=int, default=32)
	parser.add_argument('--epochs', type=int, default=100)
	parser.add_argument('--units', type=int, default=100)
	parser.add_argument('--freq', type=float, default=0.01)
	args = parser.parse_args()
	print(args)

	batch_size = seqlen = args.seqlen
	nb_epoch = args.epochs
	nb_units = args.units
	stateful = args.stateful

	freq = args.freq
	nsamples = seqlen*25
	ntest = seqlen*5

	def f(x):
	return math.sin(math.pi2(1x+.9/(math.pi2freq)(1-math.cos(math.pi2freq*x))))

	def make_sequences(seq, seqlen):
	result = []
	for i in range(0,len(seq)-seqlen):
	result.append(seq[i:i+seqlen])
	return np.array(result).reshape(-1,seqlen,1)

	X = np.array( [f(x) for x in range(0,nsamples)] )
	y = [math.sin(xmath.pi2*freq) for x in range(0,nsamples-seqlen)]

	#plt.plot(X[0:300])
	#plt.plot(y[0:300])
	#plt.show()

	X = make_sequences(X, seqlen)

	X_test = X[-ntest:]
	y_test = y[-ntest:]
	X_train = X[0:-ntest]
	y_train = y[0:-ntest]

	model = Sequential()

	model.add(LSTM(nb_units, stateful=stateful, batch_input_shape=(batch_size,seqlen,1)))
	model.add(Dropout(0.2))
	#model.add(LSTM(nb_units, stateful=stateful))
	#model.add(Dropout(0.2))
	model.add(Dense(nb_units, activation='tanh'))
	model.add(Dense(1))

	model.compile(loss='mse', optimizer='adadelta')

	model.summary()
	print("Stateful = %r" % stateful)

	model.fit(X_train, y_train,
	batch_size=batch_size, nb_epoch=nb_epoch,
	shuffle=not stateful,
	callbacks=[EarlyStopping(monitor='val_loss', patience=3, verbose=0, mode='auto')],
	verbose=1, validation_data=(X_test, y_test))