jiahao87 · September 6, 2020 09:30
diff --git a/vaex_titanic_sample.py b/vaex_titanic_sample.py
 import vaex
 import vaex.ml

 # load titanic data
 df_vaex = vaex.ml.datasets.load_titanic()

 # perform train test split
 df_train, df_test = df_vaex.ml.train_test_split(test_size=0.2)

 # One-hot encode some features
 encoder = vaex.ml.OneHotEncoder(features=['survived', 'sex', 'pclass'])
 df_train = encoder.fit_transform(df_train)
	import vaex
	import vaex.ml

	# load titanic data
	df_vaex = vaex.ml.datasets.load_titanic()

	# perform train test split
	df_train, df_test = df_vaex.ml.train_test_split(test_size=0.2)

	# One-hot encode some features
	encoder = vaex.ml.OneHotEncoder(features=['survived', 'sex', 'pclass'])
	df_train = encoder.fit_transform(df_train)