Davide Anastasia davideanastasia

Head of Data at @AuDigent // Mastermind at @shortcircuitaudio // Interested in everything data related: Machine Learning, BigData, NoSQL... you name it!

35 followers · 28 following

@AuDigent
London, UK
11:14 (UTC)
http://www.linkedin.com/in/davideanastasia

View GitHub Profile

Recently created

Least recently created

Recently updated

Least recently updated

davideanastasia / lookalike_001.py

Created February 2, 2019 11:33

	def dataframe_from_file(filename):
	try:
	taxi_data = pd.read_csv(filename, names=['taxi_id', 'ts', 'longitude', 'latitude'], parse_dates=['ts'])

	if len(taxi_data.index) == 0:
	print("skipping {} as empty".format(filename))
	return None

	taxi_data['geohash'] = np.vectorize(lambda longitude, latitude: pgh.encode(latitude, longitude, precision=6))(
	taxi_data['longitude'],

davideanastasia / bigquery_ml_0006.sql

Created October 11, 2018 21:39

	CREATE TABLE `kaggle_talkingdata_adtracking.dataset_test_submission_logreg_0001`
	AS
	SELECT click_id, prob as is_attributed
	FROM `kaggle_talkingdata_adtracking.dataset_test_with_prediction_logreg_0001`
	JOIN UNNEST(predicted_is_attributed_probs)
	WHERE label = 1
	ORDER BY click_id;

davideanastasia / bigquery_ml_0005.sql

Created October 11, 2018 21:27

	CREATE TABLE `kaggle-adfraud.kaggle_talkingdata_adtracking.dataset_test_with_prediction_logreg_0001`
	AS
	SELECT * FROM ML.PREDICT(MODEL `kaggle-adfraud.kaggle_talkingdata_adtracking.talkingdata_logreg_0001`,
	(SELECT
	click_id,
	CAST(ip AS STRING) as ip,
	CAST(app AS STRING) as app,
	CAST(device AS STRING) as device,
	CAST(os AS STRING) as os,
	CAST(channel AS STRING) as channel,

davideanastasia / bigquery_ml_0004.sql

Created October 11, 2018 21:03

	CREATE MODEL `kaggle_talkingdata_adtracking.talkingdata_logreg_0001`
	OPTIONS (
	model_type='logistic_reg',
	input_label_cols=['is_attributed'],
	data_split_method='seq',
	data_split_col='click_time'
	) AS
	SELECT CAST(ip AS STRING) as ip,
	CAST(app AS STRING) as app,
	CAST(device AS STRING) as device,

davideanastasia / bigquery_ml_0003.sql

Last active October 11, 2018 21:01

	CREATE MODEL `kaggle_talkingdata_adtracking.talkingdata_logreg_0001`
	OPTIONS (
	model_type='logistic_reg',
	input_label_cols=['is_attributed'],
	data_split_method='seq',
	data_split_col='click_time'
	) AS
	SELECT CAST(ip AS STRING) as ip,
	CAST(app AS STRING) as app,
	CAST(device AS STRING) as device,

davideanastasia / bigquery_ml_0002.sql

Created October 11, 2018 20:40

	CREATE MODEL `kaggle_talkingdata_adtracking.talkingdata_logreg_sample_0003`
	OPTIONS (
	model_type='logistic_reg',
	input_label_cols=['is_attributed'],
	data_split_method='seq',
	data_split_col='click_time'
	) AS
	SELECT CAST(ip AS STRING) as ip,
	CAST(app AS STRING) as app,
	CAST(device AS STRING) as device,

davideanastasia / bigquery_ml_0001.sql

Created October 11, 2018 20:19

	CREATE MODEL `kaggle_talkingdata_adtracking.talkingdata_logreg_sample`
	OPTIONS (
	model_type='logistic_reg',
	input_label_cols=['is_attributed']
	) AS
	SELECT ip,
	app,
	device,
	os,
	channel,

davideanastasia / unittest.2.java

Last active June 12, 2018 21:33

	public class StopWordRemoveFnTest {

	@Rule
	public final transient TestPipeline pipeline = TestPipeline.create();

	@Test
	public void testDoFn_TestPipeline() throws Exception {
	PCollection<KV<Empty, String>> input = pipeline.apply(Create.of(
	KV.of(Empty.EMPTY, "be"), KV.of(Empty.EMPTY, "is"), KV.of(Empty.EMPTY, "night"), KV.of(Empty.EMPTY, "dream")
	).withCoder(KvCoder.of(AvroCoder.of(Empty.class), StringUtf8Coder.of())));

davideanastasia / unittest.java

Created June 5, 2018 22:41

	public class StopWordRemoveFnTest {

	static private class Empty {}
	static private final Empty EMPTY = new Empty();

	@Test
	public void testDoFn() throws Exception {
	StopWordRemoveFn<Empty> doFn = new StopWordRemoveFn<>();
	DoFnTester<KV<Empty, String>, KV<Empty, String>> fnTester = DoFnTester.of(doFn);

davideanastasia / reducer.java

Created June 5, 2018 22:34

Apache Beam Getting Started - #4

	public class ReduceFn extends Combine.CombineFn<Metadata, Index, Index> {

	@Override
	public Index createAccumulator() {
	return new Index();
	}

	@Override
	public Index addInput(Index accumulator, Metadata input) {
	accumulator.add(input);

Newer Older