fahadsiddiqui · April 8, 2017 15:55 · fahadsiddiqui · Apr 8, 2017
diff --git a/variable-employee-json.scala b/variable-employee-json.scala
 scala> val thisfile = sc.textFile("/home/fahad/e.json")
 thisfile: org.apache.spark.rdd.RDD[String] = /home/fahad/e.json MapPartitionsRDD[102] at textFile at <console>:27

 scala> val rdd = sc.parallelize((thisfile.collect().mkString.replace("},", "}}\n{").dropRight(1) + "}").split("\n"))
 rdd: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[103] at parallelize at <console>:29

 scala> val xy = sqlContext.read.json(rdd)
 xy: org.apache.spark.sql.DataFrame = [emp-1: struct<age:bigint,name:string,sex:string>, emp-2: struct<age:bigint,name:string,sex:string>]
	scala> val thisfile = sc.textFile("/home/fahad/e.json")
	thisfile: org.apache.spark.rdd.RDD[String] = /home/fahad/e.json MapPartitionsRDD[102] at textFile at <console>:27

	scala> val rdd = sc.parallelize((thisfile.collect().mkString.replace("},", "}}\n{").dropRight(1) + "}").split("\n"))
	rdd: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[103] at parallelize at <console>:29

	scala> val xy = sqlContext.read.json(rdd)
	xy: org.apache.spark.sql.DataFrame = [emp-1: struct<age:bigint,name:string,sex:string>, emp-2: struct<age:bigint,name:string,sex:string>]