Jason Crocker crocker

crocker / jsonview.scala

Last active May 18, 2016 03:51

@JSONVIEW with Scala Object Mapper

	// define your json views
	object MyViews {
	class ViewA {}
	class ViewB {}
	class ViewC {}
	}

	// configure your object mapper
	val mapper = new ObjectMapper with ScalaObjectMapper
	mapper.registerModule(DefaultScalaModule)

crocker / guicenamed.scala

Created May 18, 2016 03:55

Named Guice dependencies in Scala

	val elastic = injector.getInstance[ElasticClient](
	Key.get(classOf[ElasticClient],
	Names.named("elastic"))
	)

crocker / forest.scala

Last active August 17, 2016 13:50

Scala multi-root tree or forest

	package com.signalpath.model

	import scala.collection.mutable

	class Forest[A]()(ordering: Ordering[A]) {
	val tree = new mutable.LinkedHashMap[Option[A], mutable.ListBuffer[A]]()

	def addNode(parent: Option[A], node: A): Unit = {
	val children = tree.get(parent).map(_ += node).getOrElse(mutable.ListBuffer[A](node))
	tree.put(parent,children.sorted(ordering))

crocker / mongo-update-all.js

Created August 31, 2016 14:30

db.subscription.updateMany({}, {$set: {last_processed: null}})

crocker / Weeks.scala

Created September 15, 2016 21:51

	def getDateRange(year: Int, week: Int): (LocalDate, LocalDate) = {
	val date = new LocalDate().withYear(year).withWeekOfWeekyear(week)
	val startDate = date.withDayOfWeek(1)
	val endDate = date.withDayOfWeek(7)

	(startDate, endDate)
	}

	val dateFormat = "yyyy-MM-dd E"
	val year = 2016

crocker / spark-logging-bad.scala

Created November 10, 2016 21:21

	// This will not print to your logs (no matter how many times you run it)
	dataRDD.map(c => println(c))

crocker / spark-logging-good.scala

Created November 10, 2016 21:22

	// This will print to the logs for the executors
	dataRDD.map(c => println(c)).collect()

crocker / mongodb-function.js

Last active November 17, 2016 14:45

	db.getCollection('patient').find().snapshot().forEach(
	function (p) {
	var lower_middle_name;
	if(p.middle_name) lower_middle_name = p.middle_name.toLowerCase(); else lower_middle_name = null;

	var lower_mrn;
	if(p.mrn) lower_mrn = p.mrn.toLowerCase(); else lower_mrn = null;

	var lower_email_address;
	if(p.email_address) lower_email_address = p.email_address.toLowerCase(); else lower_email_address = null;

crocker / SparkSQLJira.scala

Created February 11, 2017 02:49 — forked from marmbrus/SparkSQLJira.scala

	package com.databricks.spark.jira

	import scala.io.Source

	import org.apache.spark.rdd.RDD

	import org.apache.spark.sql._
	import org.apache.spark.sql.functions._
	import org.apache.spark.sql.sources.{TableScan, BaseRelation, RelationProvider}

crocker / spark-duplicates.scala

Last active July 2, 2020 12:15

Find duplicates in a Spark DataFrame

	val transactions = spark.read
	.option("header", "true")
	.option("inferSchema", "true")
	.json("s3n://bucket-name/transaction.json")

	transactions.groupBy("id", "organization").count.sort($"count".desc).show