cmpadden · January 12, 2022 17:16
diff --git a/pyspark_union_multiple_dfs.py b/pyspark_union_multiple_dfs.py
 from functools import reduce
 from pyspark.sql import DataFrame, SparkSession

 spark = SparkSession \
    .builder \
    .appName('Union DFs') \
    .getOrCreate()

 df1 = spark.createDataFrame(
    [
        (1, "The"),
        (2, "Quick"),
    ],
    ['id', 'text']
 )

 df2 = spark.createDataFrame(
    [
        (3, "Brown"),
        (4, "Fox"),
    ],
    ['id', 'text']
 )

 df3 = spark.createDataFrame(
    [
        (5, "Jumped"),
        (6, "Over"),
    ],
    ['id', 'text']
 )

 reduce(DataFrame.union, [df1, df2, df3]).show()

 # +---+------+
 # | id|  text|
 # +---+------+
 # |  1|   The|
 # |  2| Quick|
 # |  3| Brown|
 # |  4|   Fox|
 # |  5|Jumped|
 # |  6|  Over|
 # +---+------+
	from functools import reduce
	from pyspark.sql import DataFrame, SparkSession

	spark = SparkSession \
	.builder \
	.appName('Union DFs') \
	.getOrCreate()

	df1 = spark.createDataFrame(
	[
	(1, "The"),
	(2, "Quick"),
	],
	['id', 'text']
	)

	df2 = spark.createDataFrame(
	[
	(3, "Brown"),
	(4, "Fox"),
	],
	['id', 'text']
	)

	df3 = spark.createDataFrame(
	[
	(5, "Jumped"),
	(6, "Over"),
	],
	['id', 'text']
	)

	reduce(DataFrame.union, [df1, df2, df3]).show()

	# +---+------+
	# \| id\| text\|
	# +---+------+
	# \| 1\| The\|
	# \| 2\| Quick\|
	# \| 3\| Brown\|
	# \| 4\| Fox\|
	# \| 5\|Jumped\|
	# \| 6\| Over\|
	# +---+------+
No results found