vascoosx · November 13, 2017 10:30
diff --git a/readParquet.R b/readParquet.R
 Sys.setenv('SPARKR_SUBMIT_ARGS'='"--packages" "com.databricks:spark-csv_2.11:1.2.0" "sparkr-shell"')
 library(SparkR, lib.loc = "/home/user1/programs/spark-2.2.0-bin-hadoop2.7/R/lib/")
 sc <- sparkR.session(master = "local", appName="myapp", sparkHome = "/home/ubuntu/programs/spark-2.2.0-bin-hadoop2.7",
                  sparkConfig=list(spark.executor.memory="6g", spark.driver.memory="12g"))

 df <- collect(read.parquet("big/parquet/file1"))
 sparkR.stop()
	Sys.setenv('SPARKR_SUBMIT_ARGS'='"--packages" "com.databricks:spark-csv_2.11:1.2.0" "sparkr-shell"')
	library(SparkR, lib.loc = "/home/user1/programs/spark-2.2.0-bin-hadoop2.7/R/lib/")
	sc <- sparkR.session(master = "local", appName="myapp", sparkHome = "/home/ubuntu/programs/spark-2.2.0-bin-hadoop2.7",
	sparkConfig=list(spark.executor.memory="6g", spark.driver.memory="12g"))

	df <- collect(read.parquet("big/parquet/file1"))
	sparkR.stop()