smurching · June 14, 2022 01:36
diff --git a/README.md b/README.md
diff --git a/integration-test-job-spec.sh b/integration-test-job-spec.sh
 #!/usr/bin/env bash
 cat << EOF
 {
  "notebook_task": {
    "notebook_path": "notebooks/Train",
    "base_parameters": {
      "env": "staging"
    }
  },
  "new_cluster": {
    "spark_version": "10.5.x-cpu-ml-scala2.12",
    "node_type_id": "Standard_D3_v2",
    "num_workers": 3
  },
  "git_source": {
    "git_url": "$GIT_URL",
    "git_provider": "$GIT_PROVIDER",
    "git_commit": "$GIT_COMMIT"
  }
 }
 EOF
diff --git a/run-and-await-job.sh b/run-and-await-job.sh
 #!/usr/bin/env bash
 set -e
 JOB_JSON=$(./integration-test-job-spec.sh)
 echo "$JOB_JSON"

 # Submit the job run
 RUNS_SUBMIT_JSON=$(databricks runs submit --json "$JOB_JSON")
 JOB_RUN_ID=$(echo "$RUNS_SUBMIT_JSON" | jq .run_id)
 JOB_JSON=$(databricks runs get --run-id "$JOB_RUN_ID")
 echo "Launched job. View results at $(echo "$JOB_JSON" | jq -r .run_page_url)"

 # Wait for job completion
 while true;
 do
  JOB_JSON=$(databricks runs get --run-id "$JOB_RUN_ID")
  JOB_STATE=$(echo "$JOB_JSON" | jq .state)
  JOB_LIFECYCLE_STATE=$(echo "$JOB_STATE" | jq -r .life_cycle_state)
  JOB_RESULT_STATE=$(echo "$JOB_STATE" | jq -r .result_state)
  JOB_STATE_MESSAGE=$(echo "$JOB_STATE" | jq .state_message)

  if [ "$JOB_LIFECYCLE_STATE" = "TERMINATED" ] || [ "$JOB_LIFECYCLE_STATE" = "CANCELLED" ] || [ "$JOB_LIFECYCLE_STATE" = "SKIPPED" ]; then
    if [ "$JOB_RESULT_STATE" = "SUCCESS" ] ; then
      echo "Job completed successfully"
      exit 0
    fi
    echo "Job failed with state $JOB_RESULT_STATE and state message $JOB_STATE_MESSAGE"
    exit 1
  fi
  echo "Job still running, lifecycle state: $JOB_LIFECYCLE_STATE"
  sleep 10
 done
	#!/usr/bin/env bash
	cat << EOF
	{
	"notebook_task": {
	"notebook_path": "notebooks/Train",
	"base_parameters": {
	"env": "staging"
	}
	},
	"new_cluster": {
	"spark_version": "10.5.x-cpu-ml-scala2.12",
	"node_type_id": "Standard_D3_v2",
	"num_workers": 3
	},
	"git_source": {
	"git_url": "$GIT_URL",
	"git_provider": "$GIT_PROVIDER",
	"git_commit": "$GIT_COMMIT"
	}
	}
	EOF
	#!/usr/bin/env bash
	set -e
	JOB_JSON=$(./integration-test-job-spec.sh)
	echo "$JOB_JSON"

	# Submit the job run
	RUNS_SUBMIT_JSON=$(databricks runs submit --json "$JOB_JSON")
	JOB_RUN_ID=$(echo "$RUNS_SUBMIT_JSON" \| jq .run_id)
	JOB_JSON=$(databricks runs get --run-id "$JOB_RUN_ID")
	echo "Launched job. View results at $(echo "$JOB_JSON" \| jq -r .run_page_url)"

	# Wait for job completion
	while true;
	do
	JOB_JSON=$(databricks runs get --run-id "$JOB_RUN_ID")
	JOB_STATE=$(echo "$JOB_JSON" \| jq .state)
	JOB_LIFECYCLE_STATE=$(echo "$JOB_STATE" \| jq -r .life_cycle_state)
	JOB_RESULT_STATE=$(echo "$JOB_STATE" \| jq -r .result_state)
	JOB_STATE_MESSAGE=$(echo "$JOB_STATE" \| jq .state_message)

	if [ "$JOB_LIFECYCLE_STATE" = "TERMINATED" ] \|\| [ "$JOB_LIFECYCLE_STATE" = "CANCELLED" ] \|\| [ "$JOB_LIFECYCLE_STATE" = "SKIPPED" ]; then
	if [ "$JOB_RESULT_STATE" = "SUCCESS" ] ; then
	echo "Job completed successfully"
	exit 0
	fi
	echo "Job failed with state $JOB_RESULT_STATE and state message $JOB_STATE_MESSAGE"
	exit 1
	fi
	echo "Job still running, lifecycle state: $JOB_LIFECYCLE_STATE"
	sleep 10
	done