kokes · October 18, 2018 08:36
diff --git a/es_ira.py b/es_ira.py
 import csv
 import json
 import glob
 from elasticsearch import Elasticsearch
 from elasticsearch.helpers import parallel_bulk, bulk

 def get_data():
    with open('ira_tweets_csv_hashed.csv') as f:
        cr = csv.DictReader(f)
        for j, ln in enumerate(cr):
            yield {
                "_index": "ira",
                "_type": "tweet",
                "_id": ln['tweetid'],
                "_source": dict(ln)
            }
            
 es = Elasticsearch()

 bulk(es, get_data())
	import csv
	import json
	import glob
	from elasticsearch import Elasticsearch
	from elasticsearch.helpers import parallel_bulk, bulk

	def get_data():
	with open('ira_tweets_csv_hashed.csv') as f:
	cr = csv.DictReader(f)
	for j, ln in enumerate(cr):
	yield {
	"_index": "ira",
	"_type": "tweet",
	"_id": ln['tweetid'],
	"_source": dict(ln)
	}

	es = Elasticsearch()

	bulk(es, get_data())