l1m2p3 · January 19, 2018 06:17
diff --git a/most_frequent_words.py b/most_frequent_words.py
 import csv
 import sys
 from dynamo_access import put_words, get_words

 def get_frequent_words(dataset , numOfWords):
 	pairs = []
 	with open(dataset, 'rb') as csvfile:
 		reader = csv.reader(csvfile, delimiter=',')
 		next(reader, None)
 		for row in reader:
 			word = row[0]
 			freq = int(row[1])
 			pairs.append((word, freq))
 	pairs.sort(key=lambda x: x[1]) 
 	return [p[0] for p in pairs[0 if numOfWords > len(pairs) else len(pairs) - numOfWords:]]


 if __name__ == '__main__':
 	dataset = 'unigram_freq.csv'
 	numOfWords = 10
 	frequent_words = get_frequent_words(dataset, numOfWords)
 	put_words(frequent_words)
	import csv
	import sys
	from dynamo_access import put_words, get_words

	def get_frequent_words(dataset , numOfWords):
	pairs = []
	with open(dataset, 'rb') as csvfile:
	reader = csv.reader(csvfile, delimiter=',')
	next(reader, None)
	for row in reader:
	word = row[0]
	freq = int(row[1])
	pairs.append((word, freq))
	pairs.sort(key=lambda x: x[1])
	return [p[0] for p in pairs[0 if numOfWords > len(pairs) else len(pairs) - numOfWords:]]


	if __name__ == '__main__':
	dataset = 'unigram_freq.csv'
	numOfWords = 10
	frequent_words = get_frequent_words(dataset, numOfWords)
	put_words(frequent_words)
No results found