YordanGeorgiev · February 17, 2018 10:40
diff --git a/scala-spark-dataframe-pipeline.scala b/scala-spark-dataframe-pipeline.scala
  private def runPipeLine(cnf: Configuration): DataFrame = {
    val dfOut: DataFrame =
         new Phase1(cnf).process()
        .transform(new Phase2(cnf).process)
    return dfOut
  }
  
  
  class Phase1 extends DataFrameStage {
  
  	  override def process(dfIn: DataFrame = None): DataFrame = {
        val dfOut: DataFrame = dfIn.doSomeTransformations()
      
       return dfOut
      }
  }
  
    class Phase2 extends DataFrameStage {
  
  	  override def process(dfIn: DataFrame): DataFrame = {
        val dfOut: DataFrame = dfIn.doSomeTransformations()
      
       return dfOut
      }
  }
	private def runPipeLine(cnf: Configuration): DataFrame = {
	val dfOut: DataFrame =
	new Phase1(cnf).process()
	.transform(new Phase2(cnf).process)
	return dfOut
	}


	class Phase1 extends DataFrameStage {

	override def process(dfIn: DataFrame = None): DataFrame = {
	val dfOut: DataFrame = dfIn.doSomeTransformations()

	return dfOut
	}
	}

	class Phase2 extends DataFrameStage {

	override def process(dfIn: DataFrame): DataFrame = {
	val dfOut: DataFrame = dfIn.doSomeTransformations()

	return dfOut
	}
	}