JairoDuarte · September 29, 2019 18:51
diff --git a/wordcount.py b/wordcount.py
 import sys
 from pyspark import SparkContext

 sc = SparkContext()
 lines = sc.textFile(sys.argv[1])
 word_counts = lines.flatMap(lambda line: line.split(' ')) \
                   .map(lambda word: (word, 1)) \
                   .reduceByKey(lambda count1, count2: count1 + count2) \
                   .collect()

 for (word, count) in word_counts:
    print(word, count)
	import sys
	from pyspark import SparkContext

	sc = SparkContext()
	lines = sc.textFile(sys.argv[1])
	word_counts = lines.flatMap(lambda line: line.split(' ')) \
	.map(lambda word: (word, 1)) \
	.reduceByKey(lambda count1, count2: count1 + count2) \
	.collect()

	for (word, count) in word_counts:
	print(word, count)