harperjiang · June 21, 2019 08:28
diff --git a/README.md b/README.md
diff --git a/Nd4j_lstm.scala b/Nd4j_lstm.scala
 import org.nd4j.linalg.api.ndarray.INDArray
 import org.nd4j.linalg.api.ops.impl.broadcast.BroadcastAddOp
 import org.nd4j.linalg.api.rng.distribution.impl.UniformDistribution
 import org.nd4j.linalg.factory.Nd4j

 import scala.util.Random

 object Xavier {
  def init(shape: Array[Int]): INDArray = {
    var n = shape.dropRight(1).product
    var sd = Math.sqrt(3d / n)
    new UniformDistribution(-sd,sd).sample(shape)
  }
 }

 object LSTM extends App {

  val hiddenDim = 200
  val numChar = 100
  val c2v = Xavier.init(Array(numChar, hiddenDim))

  val v2c = Xavier.init(Array(hiddenDim, numChar))
  val inputSize = 2 * hiddenDim

  val w1 = Xavier.init(Array(inputSize, hiddenDim))
  val b1 = Nd4j.zeros(1, hiddenDim)
  val w2 = Xavier.init(Array(inputSize, hiddenDim))
  val b2 = Nd4j.zeros(1, hiddenDim)
  val w3 = Xavier.init(Array(inputSize, hiddenDim))
  val b3 = Nd4j.zeros(1, hiddenDim)
  val w4 = Xavier.init(Array(inputSize, hiddenDim))
  val b4 = Nd4j.zeros(1, hiddenDim)

  // Random Batch
  val length = 500
  val batchSize = 50
  val batch = (0 until length).map(i=> {
    Seq.fill(batchSize)(Random.nextInt(numChar)).toArray
  })
  val h0 = Nd4j.zeros(batchSize, hiddenDim)
  val c0 = Nd4j.zeros(batchSize, hiddenDim)

  val start = System.currentTimeMillis()

  val fwdmap = Nd4j.zeros(batchSize, numChar)
  batch.foreach{
    item => {
      fwdmap.assign(0)
      item.zipWithIndex.foreach(p => fwdmap.putScalar(Array(p._2, p._1), 1))
      val embedded = fwdmap.mmul(c2v)
      //val embedded = c2v.get(new SpecifiedIndex(item:_*),NDArrayIndex.all())
      val concat = Nd4j.concat(1, embedded, h0)
      val fgate = sigmoid(add(concat.mmul(w1), b1))
      val igate = sigmoid(add(concat.mmul(w2), b2))
    }
  }

  println((System.currentTimeMillis() - start).toDouble/1000)

  def add(a:INDArray, b:INDArray) = {
    Nd4j.getExecutioner.execAndReturn(new BroadcastAddOp(a,b,a,1))
  }

  def sigmoid(input:INDArray) =
    Nd4j.getExecutioner().execAndReturn(
      new org.nd4j.linalg.api.ops.impl.transforms.Sigmoid(input))

 }
diff --git a/numpy_lstm.py b/numpy_lstm.py
 import numpy as np
 from time import time

 hidden_dim = 200
 batch_size = 50
 num_char = 100

 stime = time()

 def xavier(shape):
    sq = np.sqrt(3.0 / np.prod(shape[:-1]))
    return np.random.uniform(-sq, sq, shape)

 C2V = xavier([num_char, hidden_dim])
 w1 = xavier([2 * hidden_dim, hidden_dim])
 b1 = np.zeros([hidden_dim])
 w2 = xavier([2 * hidden_dim, hidden_dim])
 b2 = np.zeros([hidden_dim])
 w3 = xavier([2 * hidden_dim, hidden_dim])
 b3 = np.zeros([hidden_dim])
 w4 = xavier([2 * hidden_dim, hidden_dim])
 b4 = np.zeros([hidden_dim])
 V2C = xavier([hidden_dim, num_char])

 def sigmoid(input):
    return 1. / (1. + np.exp(-input))
 def tanh(input):
    x_exp = np.exp(input)
    x_neg_exp = np.exp(-input)
    return (x_exp - x_neg_exp) / (x_exp + x_neg_exp)
 # Generate random batch
 length = 500
 batch = np.random.randint(num_char, size = (batch_size, length))

 h0 = np.zeros([batch_size, hidden_dim])
 c0 = np.zeros([batch_size, hidden_dim])

 for i in range(batch.shape[1]):
    item = batch[:, i]
    embed = C2V[np.int32(item),:]
    concat = np.concatenate((embed, h0), axis = 1)

    fgate = sigmoid(np.matmul(concat, w1) + b1)
    igate = sigmoid(np.matmul(concat, w2) + b2)
 t = time() - stime
 print(t)
	import org.nd4j.linalg.api.ndarray.INDArray
	import org.nd4j.linalg.api.ops.impl.broadcast.BroadcastAddOp
	import org.nd4j.linalg.api.rng.distribution.impl.UniformDistribution
	import org.nd4j.linalg.factory.Nd4j

	import scala.util.Random

	object Xavier {
	def init(shape: Array[Int]): INDArray = {
	var n = shape.dropRight(1).product
	var sd = Math.sqrt(3d / n)
	new UniformDistribution(-sd,sd).sample(shape)
	}
	}

	object LSTM extends App {

	val hiddenDim = 200
	val numChar = 100
	val c2v = Xavier.init(Array(numChar, hiddenDim))

	val v2c = Xavier.init(Array(hiddenDim, numChar))
	val inputSize = 2 * hiddenDim

	val w1 = Xavier.init(Array(inputSize, hiddenDim))
	val b1 = Nd4j.zeros(1, hiddenDim)
	val w2 = Xavier.init(Array(inputSize, hiddenDim))
	val b2 = Nd4j.zeros(1, hiddenDim)
	val w3 = Xavier.init(Array(inputSize, hiddenDim))
	val b3 = Nd4j.zeros(1, hiddenDim)
	val w4 = Xavier.init(Array(inputSize, hiddenDim))
	val b4 = Nd4j.zeros(1, hiddenDim)

	// Random Batch
	val length = 500
	val batchSize = 50
	val batch = (0 until length).map(i=> {
	Seq.fill(batchSize)(Random.nextInt(numChar)).toArray
	})
	val h0 = Nd4j.zeros(batchSize, hiddenDim)
	val c0 = Nd4j.zeros(batchSize, hiddenDim)

	val start = System.currentTimeMillis()

	val fwdmap = Nd4j.zeros(batchSize, numChar)
	batch.foreach{
	item => {
	fwdmap.assign(0)
	item.zipWithIndex.foreach(p => fwdmap.putScalar(Array(p._2, p._1), 1))
	val embedded = fwdmap.mmul(c2v)
	//val embedded = c2v.get(new SpecifiedIndex(item:_*),NDArrayIndex.all())
	val concat = Nd4j.concat(1, embedded, h0)
	val fgate = sigmoid(add(concat.mmul(w1), b1))
	val igate = sigmoid(add(concat.mmul(w2), b2))
	}
	}

	println((System.currentTimeMillis() - start).toDouble/1000)

	def add(a:INDArray, b:INDArray) = {
	Nd4j.getExecutioner.execAndReturn(new BroadcastAddOp(a,b,a,1))
	}

	def sigmoid(input:INDArray) =
	Nd4j.getExecutioner().execAndReturn(
	new org.nd4j.linalg.api.ops.impl.transforms.Sigmoid(input))

	}
	import numpy as np
	from time import time

	hidden_dim = 200
	batch_size = 50
	num_char = 100

	stime = time()

	def xavier(shape):
	sq = np.sqrt(3.0 / np.prod(shape[:-1]))
	return np.random.uniform(-sq, sq, shape)

	C2V = xavier([num_char, hidden_dim])
	w1 = xavier([2 * hidden_dim, hidden_dim])
	b1 = np.zeros([hidden_dim])
	w2 = xavier([2 * hidden_dim, hidden_dim])
	b2 = np.zeros([hidden_dim])
	w3 = xavier([2 * hidden_dim, hidden_dim])
	b3 = np.zeros([hidden_dim])
	w4 = xavier([2 * hidden_dim, hidden_dim])
	b4 = np.zeros([hidden_dim])
	V2C = xavier([hidden_dim, num_char])

	def sigmoid(input):
	return 1. / (1. + np.exp(-input))
	def tanh(input):
	x_exp = np.exp(input)
	x_neg_exp = np.exp(-input)
	return (x_exp - x_neg_exp) / (x_exp + x_neg_exp)
	# Generate random batch
	length = 500
	batch = np.random.randint(num_char, size = (batch_size, length))

	h0 = np.zeros([batch_size, hidden_dim])
	c0 = np.zeros([batch_size, hidden_dim])

	for i in range(batch.shape[1]):
	item = batch[:, i]
	embed = C2V[np.int32(item),:]
	concat = np.concatenate((embed, h0), axis = 1)

	fgate = sigmoid(np.matmul(concat, w1) + b1)
	igate = sigmoid(np.matmul(concat, w2) + b2)
	t = time() - stime
	print(t)