tokestermw · May 30, 2020 08:29 · pruksmhc · Jul 24, 2019
diff --git a/birnnlm_pytorch.py b/birnnlm_pytorch.py
 import torch, torch.nn as nn
 from torch.autograd import Variable

 text = ['BOS', 'How', 'are', 'you', 'EOS']
 seq_len = len(text)
 batch_size = 1
 embedding_size = 1
 hidden_size = 1
 output_size = 1

 random_input = Variable(
    torch.FloatTensor(seq_len, batch_size, embedding_size).normal_(), requires_grad=False)

 bi_rnn = torch.nn.RNN(
    input_size=embedding_size, hidden_size=hidden_size, num_layers=1, batch_first=False, bidirectional=True)

 bi_output, bi_hidden = bi_rnn(random_input)

 # stagger
 forward_output, backward_output = bi_output[:-2, :, :hidden_size], bi_output[2:, :, hidden_size:]
 staggered_output = torch.cat((forward_output, backward_output), dim=-1)

 linear = nn.Linear(hidden_size * 2, output_size)

 # only predict on words
 labels = random_input[1:-1]

 # for language models, use cross-entropy :)
 loss = nn.MSELoss()
 output = loss(linear(staggered_output), labels)
	import torch, torch.nn as nn
	from torch.autograd import Variable

	text = ['BOS', 'How', 'are', 'you', 'EOS']
	seq_len = len(text)
	batch_size = 1
	embedding_size = 1
	hidden_size = 1
	output_size = 1

	random_input = Variable(
	torch.FloatTensor(seq_len, batch_size, embedding_size).normal_(), requires_grad=False)

	bi_rnn = torch.nn.RNN(
	input_size=embedding_size, hidden_size=hidden_size, num_layers=1, batch_first=False, bidirectional=True)

	bi_output, bi_hidden = bi_rnn(random_input)

	# stagger
	forward_output, backward_output = bi_output[:-2, :, :hidden_size], bi_output[2:, :, hidden_size:]
	staggered_output = torch.cat((forward_output, backward_output), dim=-1)

	linear = nn.Linear(hidden_size * 2, output_size)

	# only predict on words
	labels = random_input[1:-1]

	# for language models, use cross-entropy :)
	loss = nn.MSELoss()
	output = loss(linear(staggered_output), labels)