CanoeFZH · April 11, 2018 09:29 · CanoeFZH · Apr 11, 2018
diff --git a/pyspark-udf.py b/pyspark-udf.py
 from pyspark.sql.types import StringType
 from pyspark.sql.functions import udf

 maturity_udf = udf(lambda age: "adult" if age >=18 else "child", StringType())

 df = sqlContext.createDataFrame([{'name': 'Alice', 'age': 1}])
 df.withColumn("maturity", maturity_udf(df.age))
	from pyspark.sql.types import StringType
	from pyspark.sql.functions import udf

	maturity_udf = udf(lambda age: "adult" if age >=18 else "child", StringType())

	df = sqlContext.createDataFrame([{'name': 'Alice', 'age': 1}])
	df.withColumn("maturity", maturity_udf(df.age))
No results found