VeylanSolmira VeylanSolmira

VeylanSolmira / spark_gzip.py

Last active August 29, 2015 14:18 — forked from msukmanowsky/spark_gzip.py

	from pyspark import SparkContext


	def main():
	sc = SparkContext(appName="Test Compression")
	# RDD has to be key, value pairs
	data = sc.parallelize([
	("key1", "value1"),
	("key2", "value2"),
	("key3", "value3"),