oluies · September 12, 2016 13:04
diff --git a/vectorsum.scala b/vectorsum.scala
 import org.apache.spark.sql.Row
 import breeze.linalg.DenseVector 
 import org.apache.spark.mllib.linalg.{Vector, Vectors}

 val t_df = sqlContext.read.parquet("/user/s89718/Pivoted_cust_weekday_total_with_Clusters.parquet")
 val tm_df = t_df.select("IP_ID","assembled")
 val emptyVector = BDV(Array.fill(7)(0.0))

 val zeVector = tm_df
  .rdd
  .map{ case Row(k: String, v: Vector) =>  (k, DenseVector(v.toDense.values)) }
  .map( _._2 )
  .fold(emptyVector){ (acc,t) => acc += t }
 
 val zeVectorDense = Vectors.dense(zeVector.toArray)

 println(zeVectorDense)
	import org.apache.spark.sql.Row
	import breeze.linalg.DenseVector
	import org.apache.spark.mllib.linalg.{Vector, Vectors}

	val t_df = sqlContext.read.parquet("/user/s89718/Pivoted_cust_weekday_total_with_Clusters.parquet")
	val tm_df = t_df.select("IP_ID","assembled")
	val emptyVector = BDV(Array.fill(7)(0.0))

	val zeVector = tm_df
	.rdd
	.map{ case Row(k: String, v: Vector) => (k, DenseVector(v.toDense.values)) }
	.map( _._2 )
	.fold(emptyVector){ (acc,t) => acc += t }

	val zeVectorDense = Vectors.dense(zeVector.toArray)

	println(zeVectorDense)
No results found