- create dataframe
val ds = List(1,2).toDS
# org.apache.spark.sql.Dataset[Int] = [value: int]
val df = List(1,2).toDF
# org.apache.spark.sql.DataFrame = [value: int]
- dataframe diff
except
を使用する。左辺の差分
df1.except(df2)
- rdd
subtract
を使用する
rdd.subtract(rdd2)
df.na.drop()
訓練データにそもそものUserItem
もしくわProductItem
が存在しないため
df.join(df2, $"df.id" === $"df2.id", "left_join")
df.select($"rating".cast(DecimalType(18, 5))