hakanilter · October 14, 2018 23:15
diff --git a/CreateSparkDataFrameFromAzureBlobStorage.scala b/CreateSparkDataFrameFromAzureBlobStorage.scala
 /*
  Add following dependencies:
    com.microsoft.azure:azure-storage:2.0.0
    org.apache.hadoop:hadoop-azure:2.7.3
  Exclude:
    com.fasterxml.jackson.core:*:*
 */
 spark.conf.set(
  "fs.azure.account.key.<your-storage-account-name>.blob.core.windows.net",
  "<your-storage-account-access-key>")

 sc.hadoopConfiguration.set("fs.azure", "org.apache.hadoop.fs.azure.NativeAzureFileSystem")
 sc.hadoopConfiguration.set("fs.AbstractFileSystem.wasb.Impl", "org.apache.hadoop.fs.azure.Wasb")

 val df = spark.read.parquet("wasbs://<your-container-name>@<your-storage-account-name>.blob.core.windows.net/datapyro/items")
 df.printSchema
	/*
	Add following dependencies:
	com.microsoft.azure:azure-storage:2.0.0
	org.apache.hadoop:hadoop-azure:2.7.3
	Exclude:
	com.fasterxml.jackson.core::
	*/
	spark.conf.set(
	"fs.azure.account.key.<your-storage-account-name>.blob.core.windows.net",
	"<your-storage-account-access-key>")

	sc.hadoopConfiguration.set("fs.azure", "org.apache.hadoop.fs.azure.NativeAzureFileSystem")
	sc.hadoopConfiguration.set("fs.AbstractFileSystem.wasb.Impl", "org.apache.hadoop.fs.azure.Wasb")

	val df = spark.read.parquet("wasbs://<your-container-name>@<your-storage-account-name>.blob.core.windows.net/datapyro/items")
	df.printSchema