eliasah · May 22, 2018 15:07
diff --git a/job_submit.sh b/job_submit.sh
 #!/bin/bash

 curl -X POST http://[spark-cluster-ip]:6066/v1/submissions/create --header "Content-Type:application/json;charset=UTF-8" --data '{
   "action":"CreateSubmissionRequest",
   "appArgs":[
      "/home/eliasah/Desktop/spark_pi.py"
   ],
   "appResource":"file:/home/eliasah/Desktop/spark_pi.py",
   "clientSparkVersion":"2.2.1",
   "environmentVariables":{
      "SPARK_ENV_LOADED":"1"
   },
   "mainClass":"org.apache.spark.deploy.SparkSubmit",
   "sparkProperties":{
      "spark.driver.supervise":"false",
      "spark.app.name":"Simple App",
      "spark.eventLog.enabled":"true",
      "spark.submit.deployMode":"cluster",
      "spark.master":"spark://[spark-master]:6066"
   }
 }' 
diff --git a/result.json b/result.json
 {
  "action" : "CreateSubmissionResponse",
  "message" : "Driver successfully submitted as driver-20180522165321-0001",
  "serverSparkVersion" : "2.2.1",
  "submissionId" : "driver-20180522165321-0001",
  "success" : true
 }
diff --git a/spark_pi.py b/spark_pi.py
 from __future__ import print_function

 import sys
 from random import random
 from operator import add

 from pyspark.sql import SparkSession


 if __name__ == "__main__":
    """
        Usage: pi [partitions]
    """
    spark = SparkSession\
        .builder\
        .appName("PythonPi")\
        .getOrCreate()

    partitions = int(sys.argv[1]) if len(sys.argv) > 1 else 2
    n = 100000 * partitions

    def f(_):
        x = random() * 2 - 1
        y = random() * 2 - 1
        return 1 if x ** 2 + y ** 2 <= 1 else 0

    count = spark.sparkContext.parallelize(range(1, n + 1), partitions).map(f).reduce(add)
    print("Pi is roughly %f" % (4.0 * count / n))

    spark.stop()
	#!/bin/bash

	curl -X POST http://[spark-cluster-ip]:6066/v1/submissions/create --header "Content-Type:application/json;charset=UTF-8" --data '{
	"action":"CreateSubmissionRequest",
	"appArgs":[
	"/home/eliasah/Desktop/spark_pi.py"
	],
	"appResource":"file:/home/eliasah/Desktop/spark_pi.py",
	"clientSparkVersion":"2.2.1",
	"environmentVariables":{
	"SPARK_ENV_LOADED":"1"
	},
	"mainClass":"org.apache.spark.deploy.SparkSubmit",
	"sparkProperties":{
	"spark.driver.supervise":"false",
	"spark.app.name":"Simple App",
	"spark.eventLog.enabled":"true",
	"spark.submit.deployMode":"cluster",
	"spark.master":"spark://[spark-master]:6066"
	}
	}'
	{
	"action" : "CreateSubmissionResponse",
	"message" : "Driver successfully submitted as driver-20180522165321-0001",
	"serverSparkVersion" : "2.2.1",
	"submissionId" : "driver-20180522165321-0001",
	"success" : true
	}
	from __future__ import print_function

	import sys
	from random import random
	from operator import add

	from pyspark.sql import SparkSession


	if __name__ == "__main__":
	"""
	Usage: pi [partitions]
	"""
	spark = SparkSession\
	.builder\
	.appName("PythonPi")\
	.getOrCreate()

	partitions = int(sys.argv[1]) if len(sys.argv) > 1 else 2
	n = 100000 * partitions

	def f(_):
	x = random() * 2 - 1
	y = random() * 2 - 1
	return 1 if x 2 + y 2 <= 1 else 0

	count = spark.sparkContext.parallelize(range(1, n + 1), partitions).map(f).reduce(add)
	print("Pi is roughly %f" % (4.0 * count / n))

	spark.stop()