🐗

Justin Evans eustin

🐗

Learning

eustin / letor-part-1-model-vocab-size.py

Created May 25, 2020 22:37

	VOCAB_SIZE = max(tokeniser.index_word) + 1
	print(f"VOCAB_SIZE: {VOCAB_SIZE}")

eustin / letor-part-1-model-sequences.py

Created May 25, 2020 22:36

	sequences = tokeniser.texts_to_sequences(sentences)
	for x in sequences:
	print(x)

eustin / letor-part-1-model-tokeniser.py

Created May 25, 2020 22:35

	tokeniser = tf.keras.preprocessing.text.Tokenizer()
	tokeniser.fit_on_texts(sentences)

	print(tokeniser.word_index)

eustin / letor-part-1-model-sentences.py

Created May 25, 2020 22:35

eustin / letor-part-1-dense-dist-1.py

Created May 25, 2020 22:30

	snoopy_vs_beagle = tf.sqrt(tf.reduce_sum(tf.square(embeddings[0] - embeddings[3])))
	snoopy_vs_is = tf.sqrt(tf.reduce_sum(tf.square(embeddings[0] - embeddings[1])))

	print(snoopy_vs_beagle.numpy())
	print(snoopy_vs_is.numpy())

eustin / letor-part-1-one-hot-dist-2.py

Created May 25, 2020 22:29

	is_vec = index_one_hot[1]

	snoopy_vs_is = tf.sqrt(tf.reduce_sum(tf.square(snoopy_vec - is_vec)))

	print(snoopy_vs_is.numpy())

eustin / letor-part-1-one-hot-dist-1.py

Created May 25, 2020 22:28

	snoopy_vec = index_one_hot[0]
	beagle_vec = index_one_hot[3]

	snoopy_vs_beagle = tf.sqrt(tf.reduce_sum(tf.square(snoopy_vec - beagle_vec)))

	print(snoopy_vs_beagle.numpy())

eustin / letor-part-1-embeddings.py

Created May 25, 2020 22:27

	embeddings = tf.random.uniform((4, 2), minval=-0.05, maxval=0.05).numpy()

	print(embeddings)

eustin / letor-part-1-one-hot.py

Last active May 25, 2020 22:21

	num_classes = len(index_word)

	index_one_hot = {i: tf.one_hot(x, depth=num_classes) \
	for i, x in enumerate(index_word.keys())}

	for k, v in index_one_hot.items():
	word = index_word[k]
	one_hot_vector = v.numpy()
	print(f"{word:<6}: {one_hot_vector}")

eustin / letor-part-1-indices.py

Created May 25, 2020 22:20

	index_word = {i: x for i, x in enumerate(tokens)}

	print(index_word)