girisandeep · May 26, 2021 14:04
diff --git a/saving-loading-sequencefiles.scala b/saving-loading-sequencefiles.scala
 //Save it
 var rdd = sc.parallelize(Array(("key1", 1.0), ("key2", 2.0), ("key3", 3.0)), 2)
 rdd.saveAsSequenceFile("pysequencefile1")

 //Load it
 import org.apache.hadoop.io.DoubleWritable
 import org.apache.hadoop.io.Text

 val myrdd = sc.sequenceFile(
 "pysequencefile1", 
 classOf[Text], classOf[DoubleWritable])

 val result = myrdd.map{case (x, y) => (x.toString, y.get())}
 result.collect()

 //Array((key1,1.0), (key2,2.0), (key3,3.0))
	//Save it
	var rdd = sc.parallelize(Array(("key1", 1.0), ("key2", 2.0), ("key3", 3.0)), 2)
	rdd.saveAsSequenceFile("pysequencefile1")

	//Load it
	import org.apache.hadoop.io.DoubleWritable
	import org.apache.hadoop.io.Text

	val myrdd = sc.sequenceFile(
	"pysequencefile1",
	classOf[Text], classOf[DoubleWritable])

	val result = myrdd.map{case (x, y) => (x.toString, y.get())}
	result.collect()

	//Array((key1,1.0), (key2,2.0), (key3,3.0))
No results found