Focusing

Kung-Hsiang Steeve Huang khuangaf

Focusing

Research Scientist @ Salesforce Research | Formerly: PhD @ UIUC, PhD Fellow @ Amazon, MSc @ USC, BEng @ HKUST | He/him/his 🇹🇼

khuangaf / gist:f8c9ba02294071f699340f3670c6eb1f

Last active May 11, 2019 15:11

	from sklearn.preprocessing import LabelEncoder

	df = pd.read_csv('../input/yoochoose-click.dat', header=None)
	df.columns=['session_id','timestamp','item_id','category']

	buy_df = pd.read_csv('../input/yoochoose-buys.dat', header=None)
	buy_df.columns=['session_id','timestamp','item_id','price','quantity']

	item_encoder = LabelEncoder()
	df['item_id'] = item_encoder.fit_transform(df.item_id)

khuangaf / gist:f2ea4d54758d5c406f2a45a7716335e8

Created May 6, 2019 14:09

	import torch
	from torch_geometric.data import Data


	x = torch.tensor([[2,1], [5,6], [3,7], [12,0]], dtype=torch.float)
	y = torch.tensor([0, 1, 0, 1], dtype=torch.float)

	edge_index = torch.tensor([[0, 2, 1, 0, 3],
	[3, 1, 0, 1, 2]], dtype=torch.long)

khuangaf / gist:d6d98ba9581c071d705e2d31942eaf8c

Created May 6, 2019 14:04

	edge_index = torch.tensor([[0, 2, 1, 0, 3],
	[3, 1, 0, 1, 2]], dtype=torch.long)

khuangaf / gist:aaf263fc36c662fac3fe8c964de05f76

Created May 6, 2019 14:04

	edge_index = torch.tensor([[0, 2, 1, 0, 3],
	[3, 1, 0, 1, 2]], dtype=torch.long)

khuangaf / gist:cf56d3526ff6591792df936cdb7d0953

Last active May 6, 2019 14:01

	edge_index = torch.tensor([[0, 1, 2, 0, 3],
	[1, 0, 1, 3, 2]], dtype=torch.long)

khuangaf / gist:fe3710750fe0cfb5ecddf27b8685fd33

Last active May 6, 2019 13:55

	x = torch.tensor([[2,1], [5,6], [3,7], [12,0]], dtype=torch.float)
	y = torch.tensor([0, 1, 0, 1], dtype=torch.float)

khuangaf / CategoricalEncoder.py

Last active March 31, 2019 19:19

This class is intended for faster and simpler categorical/ label encoding on large data, in which sklearn's LabelEncoder might be too slow.

	'''
	Author: Kung-hsiang, Huang (Steeve)
	Date: 2019/Mar/15
	'''

	class CategoricalEncoder():
	'''
	This class is for those operating on large data, in which sklearn's LabelEncoder class may take too much time.
	This encoder is only suitable for 1-d array/ list. You may modify it to become n-d compatible.
	'''

khuangaf / gist:41e3de743e4dcd9f8748cde47a6cd434

Created September 3, 2018 12:11

	def forward(self, user_indices, item_indices, titles):
	user_embedding_mlp = self.embedding_user_mlp(user_indices)
	item_embedding_mlp = self.embedding_item_mlp(item_indices)
	user_embedding_mf = self.embedding_user_mf(user_indices)
	item_embedding_mf = self.embedding_item_mf(item_indices)

	#### mf part
	mf_vector =torch.mul(user_embedding_mf, item_embedding_mf)
	mf_vector = torch.nn.Dropout(self.config.dropout_rate_mf)(mf_vector)

khuangaf / gist:84eab97783dc7077881f90928278de2a

Created September 3, 2018 11:33

	def __init__(self, config):
	super(NeuMF, self).__init__()

	#mf part
	self.embedding_user_mf = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mf)
	self.embedding_item_mf = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim_mf)

	#mlp part
	self.embedding_user_mlp = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mlp)
	self.embedding_item_mlp = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim_mlp)

khuangaf / gist:bf2a216019d29a4a1014f71dbfff51d0

Last active March 4, 2025 15:16

NeuMF

	class NeuMF(torch.nn.Module):
	def __init__(self, config):
	super(NeuMF, self).__init__()

	#mf part
	self.embedding_user_mf = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mf)
	self.embedding_item_mf = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim_mf)

	#mlp part
	self.embedding_user_mlp = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mlp)