questsin · February 20, 2019 16:50
diff --git a/python spark sql (cheat sheet) .py b/python spark sql (cheat sheet) .py
 import pixiedust
 import pixiedust_node
 inspections = pixiedust.sampleData("https://opendata.lasvegasnevada.gov/resource/86jg-3buh.csv")

 import pyspark

 # Create a SparkContext in local mode
 sc = pyspark.SparkContext("local")

 # Create a SqlContext from the SparkContext
 sqlContext = pyspark.SQLContext(sc)

 data = [
    (1, 'a'), 
    (2, 'b'), 
    (3, 'c'), 
    (4, 'd'), 
    (5, 'e'), 
    (6, 'a'), 
    (7, 'b'), 
    (8, 'c'), 
    (9, 'd'), 
    (10, 'e')
 ]

 # Convert a local data set into a DataFrame
 df = sqlContext.createDataFrame(data, ['numbers', 'letters'])

 # Convert to a Pandas DataFrame for easy display
 df.toPandas()

 # Register the DataFrame as a table
 df.registerTempTable("mytable")

 # Peform a simple select from the table
 results = sqlContext.sql("select * from mytable")

 # Convert the results to a Pandas DataFrame for easy viewing
 results.toPandas()

 sc.stop()
	import pixiedust
	import pixiedust_node
	inspections = pixiedust.sampleData("https://opendata.lasvegasnevada.gov/resource/86jg-3buh.csv")

	import pyspark

	# Create a SparkContext in local mode
	sc = pyspark.SparkContext("local")

	# Create a SqlContext from the SparkContext
	sqlContext = pyspark.SQLContext(sc)

	data = [
	(1, 'a'),
	(2, 'b'),
	(3, 'c'),
	(4, 'd'),
	(5, 'e'),
	(6, 'a'),
	(7, 'b'),
	(8, 'c'),
	(9, 'd'),
	(10, 'e')
	]

	# Convert a local data set into a DataFrame
	df = sqlContext.createDataFrame(data, ['numbers', 'letters'])

	# Convert to a Pandas DataFrame for easy display
	df.toPandas()

	# Register the DataFrame as a table
	df.registerTempTable("mytable")

	# Peform a simple select from the table
	results = sqlContext.sql("select * from mytable")

	# Convert the results to a Pandas DataFrame for easy viewing
	results.toPandas()

	sc.stop()