beckyconning · July 4, 2019 23:43
diff --git a/README.md b/README.md
diff --git a/index.js b/index.js
 const Buffer = require('safe-buffer').Buffer;
 const Compute = require('@google-cloud/compute');
 const reattempt = require('reattempt-promise-function');

 const compute = new Compute();

 require('es6-promise').polyfill();

 exports.startInstancePubSub = (data, context) => {
  const payload = _validatePayload(JSON.parse(Buffer.from(data.data, 'base64').toString()));
  const vm = compute.zone(payload.zone).vm(payload.instance);
  
  return setMetadata(vm, dekeyvalueize(keyvalueize(payload.metadata).map(predicated(hasKey("startup-script"))(appendValue(finale(resetMetaDataAndShutdown(payload.zone)(keyvalueize(payload.originalMetadata))))))))
      .then(() => vm.stop())
      .then(data => {
        // Operation pending.
        const operation = data[0];
        return operation.promise();
      })
      .then(() => {
        const message = 'Successfully stopped instance ' + payload.instance;
        console.log(message);
        return vm.start();
      })
      .then(data => {
        // Operation pending.
        const operation = data[0];
        return operation.promise();
      })
      .then(() => {
        const message = 'Successfully started instance ' + payload.instance;
        console.log(message);
      });
 };

 const setMetadata = (vm, metadata) =>
  vm.setMetadata(metadata)
    .then(data => {
      const operation = data[0];
      return operation.promise();
    })
    .then(() =>
       reattempt(() => {
        return vm.getMetadata().then(data => {
          const actual = JSON.stringify(dekeyvalueize(data[0].metadata.items));
          const expected = JSON.stringify(metadata);
          if (actual === expected) {
            return Promise.resolve(data);
          } else {
            return Promise.reject("Retreived metadata didn't equal " + JSON.stringify(metadata));
          }
        });
      }, [], 1000, 20)
    )
    .then(data => {
      console.log("Successfully set metadata " + JSON.stringify(metadata));
    });

 const gcloudFormatize = arr => Array.isArray(arr) ? arr.map(obj => obj.key + "=\"" + obj.value + "\"").join(",") : "";

 const resetMetaDataAndShutdown = zone => metadata => "gcloud compute instances remove-metadata slamdata-bigquery --all --zone " + zone + (Array.isArray(metadata) && metadata.length > 0 ? " && gcloud compute instances add-metadata slamdata-bigquery --zone " + zone + " --metadata " + gcloudFormatize(metadata) : "") + " && gcloud compute instances stop slamdata-bigquery --zone " + zone;

 const finale = s => " && (" + s + ") || (" + s + ")";

 const predicated = p => f => x => p(x) ? f(x) : x;

 const hasKey = key => obj => obj.key && obj.key === key;

 const appendValue = suffix => obj => { return { key: obj.key, value: obj.value + suffix } };

 const keyvalueize = obj => Object.keys(obj).map(key => { return { key: key, value: obj[key] }; });

 const dekeyvalueize = arr => Array.isArray(arr) ? arr.reduce((acc, obj) => { return { ...acc, [obj.key]: obj.value }; }, {}) : {};

 /**
 * Validates that a request payload contains the expected fields.
 *
 * @param {!object} payload the request payload to validate.
 * @returns {!object} the payload object.
 */
 function _validatePayload (payload) {
  if (!payload.zone) {
    throw new Error(`Attribute 'zone' missing from payload`);
  } else if (!payload.instance) {
    throw new Error(`Attribute 'instance' missing from payload`);
  } else if (!payload.metadata) {
    throw new Error(`Attribute 'metadata' missing from payload`);
  } else if (!payload.originalMetadata) {
    throw new Error(`Attribute 'originalMetadata' missing from payload`);
  }

  return payload;
 }
diff --git a/package.json b/package.json
 {
  "name": "cloud-functions-schedule-instance",
  "version": "0.0.1",
  "private": true,
  "license": "Apache-2.0",
  "author": "Google Inc.",
  "repository": {
    "type": "git",
    "url": "https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git"
  },
  "engines": {
    "node": ">=6.0"
  },
  "scripts": {
    "lint": "semistandard '**/*.js'",
    "pretest": "npm run lint",
    "test": "ava -T 20s --verbose test/*.test.js"
  },
  "devDependencies": {
    "@google-cloud/nodejs-repo-tools": "^2.2.5",
    "ava": "^0.25.0",
    "proxyquire": "^2.0.0",
    "sinon": "^4.4.2"
  },
  "dependencies": {
    "@google-cloud/compute": "^0.10.0",
    "safe-buffer": "5.1.2",
    "reattempt-promise-function": "1.0.0",
    "promise.prototype.finally": "3.1.0"
  }
 }
diff --git a/payload.json b/payload.json
 {
  "zone": "<zone>",
  "instance": "slamdata-bigquery",
  "metadata": {
    "startup-script": "/home/<username>/sd-bq.sh <project> <dataset> '{}' no_partitioning http://localhost"
  },
  "originalMetadata": {}
 }
diff --git a/sd-bq-single.sh b/sd-bq-single.sh
 #!/bin/bash

 set -e
 set -o pipefail

 ACCESS_TOKEN=$(gcloud auth application-default print-access-token)

 DESTINATION_PROJECT_ID=$1
 DESTINATION_DATASET_ID=$2
 FLOAT64_COLUMN_NAMES=$3
 PARTITIONING=$4
 TABLE_URL=$5

 echo "Getting virtual table name..."
 TABLE_INFO=$(curl --fail "$TABLE_URL")

 echo "Table info:"
 echo "${TABLE_INFO}"

 TABLE_NAME_ORIGINAL=$(echo "${TABLE_INFO}" | jq -r .name)
 TABLE_NAME=$(echo "${TABLE_NAME_ORIGINAL}" | perl -pe 'chomp if eof' | perl -pe 's/[^A-Za-z0-9]/_/g')
 echo "Virtual table name: ${TABLE_NAME}"

 TABLE_COLUMNS=$(echo "${TABLE_INFO}" | jq "[.columns | .[] | .type = if (.column as \$column | ${FLOAT64_COLUMN_NAMES} | .\"${TABLE_NAME_ORIGINAL}\" | index(\$column)) then \"FLOAT64\" elif .type == \"offsetdatetime\" then \"TIMESTAMP\" elif .type == \"number\" then \"NUMERIC\" elif .type == \"string\" then \"STRING\" elif .type == \"boolean\" then \"BOOLEAN\" else null end | .[\"name\"] = (.column | gsub(\"[ ]\"; \"_\")) | del(.column)]")

 echo "Virtual table columns: ${TABLE_COLUMNS}"

 PARTITIONING_INFO=$(if [ "$PARTITIONING" = "day_partitioning" ]; then printf '"timePartitioning": { "type": "DAY" },'; else printf ''; fi)
 WRITE_DISPOSITION=$(if [ "$PARTITIONING" = "day_partitioning" ]; then printf 'WRITE_APPEND'; else printf 'WRITE_TRUNCATE'; fi)

 JOB_CONFIGURATION=\
 "{\
   \"configuration\": {\
     \"load\": {\
       \"sourceFormat\": \"CSV\",\
       \"skipLeadingRows\": 1,\
       \"allowQuotedNewlines\": true,\
       \"schemaUpdateOptions\": [ \"ALLOW_FIELD_ADDITION\" ],\
       \"schema\": {\
         \"fields\": $TABLE_COLUMNS\
       },$PARTITIONING_INFO\
       \"writeDisposition\": \"$WRITE_DISPOSITION\",\
       \"destinationTable\": {\
         \"projectId\": \"$DESTINATION_PROJECT_ID\",\
         \"datasetId\": \"$DESTINATION_DATASET_ID\",\
         \"tableId\": \"$TABLE_NAME\"\
       }\
     }\
   }\
 }"

 echo "Job configuration: ${JOB_CONFIGURATION}"

 echo "Creating job..."
 JOB_URL_PRIME=$(echo $JOB_CONFIGURATION | curl --fail -i -H "Authorization: Bearer $ACCESS_TOKEN" -H "Content-type: application/json" --data @- -X POST "https://www.googleapis.com/upload/bigquery/v2/projects/${DESTINATION_PROJECT_ID}/jobs?uploadType=resumable")

 echo "Job url prime: ${JOB_URL_PRIME}"
 JOB_URL=$(printf "${JOB_URL_PRIME}" | perl -n -e '/^Location: (.*)/i && print $1')

 echo "Job URL: ${JOB_URL}"

 echo "Streaming virtual table into Google BigQuery..."
 curl --fail "$TABLE_URL/live/dataset" | curl --fail -X PUT --data-binary @- ${JOB_URL%$'\r'}
diff --git a/sd-bq.sh b/sd-bq.sh
 #!/bin/bash

 set -e
 set -o pipefail

 SCRIPT_DIRECTORY=$(dirname "${BASH_SOURCE}")

 DESTINATION_PROJECT_ID=$1

 DESTINATION_DATASET_ID=$2

 FLOAT64_COLUMN_NAMES=$3

 PARTITIONING=$4

 VIRTUAL_TABLES_URL="${5}/api/tables"

 VIRTUAL_TABLE_URL_PREFIX="${5}/api/table/"

 echo "Getting virtual table URLs"

 VIRTUAL_TABLE_URLS=$(for i in {1..15}; do curl --fail "${VIRTUAL_TABLES_URL}" | jq -r 'to_entries | map(select(select(.value."name" | contains("[Archived] ") | not))) | from_entries | keys | .[]' | sed -e "s#^#${VIRTUAL_TABLE_URL_PREFIX}#" && break || sleep 5; done)

 echo "$VIRTUAL_TABLE_URLS"

 echo "Running process for each virtual table"

 echo "$VIRTUAL_TABLE_URLS" | xargs -L1 $SCRIPT_DIRECTORY/sd-bq-single.sh $DESTINATION_PROJECT_ID $DESTINATION_DATASET_ID "$FLOAT64_COLUMN_NAMES" $PARTITIONING
	const Buffer = require('safe-buffer').Buffer;
	const Compute = require('@google-cloud/compute');
	const reattempt = require('reattempt-promise-function');

	const compute = new Compute();

	require('es6-promise').polyfill();

	exports.startInstancePubSub = (data, context) => {
	const payload = _validatePayload(JSON.parse(Buffer.from(data.data, 'base64').toString()));
	const vm = compute.zone(payload.zone).vm(payload.instance);

	return setMetadata(vm, dekeyvalueize(keyvalueize(payload.metadata).map(predicated(hasKey("startup-script"))(appendValue(finale(resetMetaDataAndShutdown(payload.zone)(keyvalueize(payload.originalMetadata))))))))
	.then(() => vm.stop())
	.then(data => {
	// Operation pending.
	const operation = data[0];
	return operation.promise();
	})
	.then(() => {
	const message = 'Successfully stopped instance ' + payload.instance;
	console.log(message);
	return vm.start();
	})
	.then(data => {
	// Operation pending.
	const operation = data[0];
	return operation.promise();
	})
	.then(() => {
	const message = 'Successfully started instance ' + payload.instance;
	console.log(message);
	});
	};

	const setMetadata = (vm, metadata) =>
	vm.setMetadata(metadata)
	.then(data => {
	const operation = data[0];
	return operation.promise();
	})
	.then(() =>
	reattempt(() => {
	return vm.getMetadata().then(data => {
	const actual = JSON.stringify(dekeyvalueize(data[0].metadata.items));
	const expected = JSON.stringify(metadata);
	if (actual === expected) {
	return Promise.resolve(data);
	} else {
	return Promise.reject("Retreived metadata didn't equal " + JSON.stringify(metadata));
	}
	});
	}, [], 1000, 20)
	)
	.then(data => {
	console.log("Successfully set metadata " + JSON.stringify(metadata));
	});

	const gcloudFormatize = arr => Array.isArray(arr) ? arr.map(obj => obj.key + "=\"" + obj.value + "\"").join(",") : "";

	const resetMetaDataAndShutdown = zone => metadata => "gcloud compute instances remove-metadata slamdata-bigquery --all --zone " + zone + (Array.isArray(metadata) && metadata.length > 0 ? " && gcloud compute instances add-metadata slamdata-bigquery --zone " + zone + " --metadata " + gcloudFormatize(metadata) : "") + " && gcloud compute instances stop slamdata-bigquery --zone " + zone;

	const finale = s => " && (" + s + ") \|\| (" + s + ")";

	const predicated = p => f => x => p(x) ? f(x) : x;

	const hasKey = key => obj => obj.key && obj.key === key;

	const appendValue = suffix => obj => { return { key: obj.key, value: obj.value + suffix } };

	const keyvalueize = obj => Object.keys(obj).map(key => { return { key: key, value: obj[key] }; });

	const dekeyvalueize = arr => Array.isArray(arr) ? arr.reduce((acc, obj) => { return { ...acc, [obj.key]: obj.value }; }, {}) : {};

	/**
	* Validates that a request payload contains the expected fields.
	*
	* @param {!object} payload the request payload to validate.
	* @returns {!object} the payload object.
	*/
	function _validatePayload (payload) {
	if (!payload.zone) {
	throw new Error(`Attribute 'zone' missing from payload`);
	} else if (!payload.instance) {
	throw new Error(`Attribute 'instance' missing from payload`);
	} else if (!payload.metadata) {
	throw new Error(`Attribute 'metadata' missing from payload`);
	} else if (!payload.originalMetadata) {
	throw new Error(`Attribute 'originalMetadata' missing from payload`);
	}

	return payload;
	}
	{
	"name": "cloud-functions-schedule-instance",
	"version": "0.0.1",
	"private": true,
	"license": "Apache-2.0",
	"author": "Google Inc.",
	"repository": {
	"type": "git",
	"url": "https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git"
	},
	"engines": {
	"node": ">=6.0"
	},
	"scripts": {
	"lint": "semistandard '*/.js'",
	"pretest": "npm run lint",
	"test": "ava -T 20s --verbose test/*.test.js"
	},
	"devDependencies": {
	"@google-cloud/nodejs-repo-tools": "^2.2.5",
	"ava": "^0.25.0",
	"proxyquire": "^2.0.0",
	"sinon": "^4.4.2"
	},
	"dependencies": {
	"@google-cloud/compute": "^0.10.0",
	"safe-buffer": "5.1.2",
	"reattempt-promise-function": "1.0.0",
	"promise.prototype.finally": "3.1.0"
	}
	}
	{
	"zone": "<zone>",
	"instance": "slamdata-bigquery",
	"metadata": {
	"startup-script": "/home/<username>/sd-bq.sh <project> <dataset> '{}' no_partitioning http://localhost"
	},
	"originalMetadata": {}
	}
	#!/bin/bash

	set -e
	set -o pipefail

	ACCESS_TOKEN=$(gcloud auth application-default print-access-token)

	DESTINATION_PROJECT_ID=$1
	DESTINATION_DATASET_ID=$2
	FLOAT64_COLUMN_NAMES=$3
	PARTITIONING=$4
	TABLE_URL=$5

	echo "Getting virtual table name..."
	TABLE_INFO=$(curl --fail "$TABLE_URL")

	echo "Table info:"
	echo "${TABLE_INFO}"

	TABLE_NAME_ORIGINAL=$(echo "${TABLE_INFO}" \| jq -r .name)
	TABLE_NAME=$(echo "${TABLE_NAME_ORIGINAL}" \| perl -pe 'chomp if eof' \| perl -pe 's/[^A-Za-z0-9]/_/g')
	echo "Virtual table name: ${TABLE_NAME}"

	TABLE_COLUMNS=$(echo "${TABLE_INFO}" \| jq "[.columns \| .[] \| .type = if (.column as \$column \| ${FLOAT64_COLUMN_NAMES} \| .\"${TABLE_NAME_ORIGINAL}\" \| index(\$column)) then \"FLOAT64\" elif .type == \"offsetdatetime\" then \"TIMESTAMP\" elif .type == \"number\" then \"NUMERIC\" elif .type == \"string\" then \"STRING\" elif .type == \"boolean\" then \"BOOLEAN\" else null end \| .[\"name\"] = (.column \| gsub(\"[ ]\"; \"_\")) \| del(.column)]")

	echo "Virtual table columns: ${TABLE_COLUMNS}"

	PARTITIONING_INFO=$(if [ "$PARTITIONING" = "day_partitioning" ]; then printf '"timePartitioning": { "type": "DAY" },'; else printf ''; fi)
	WRITE_DISPOSITION=$(if [ "$PARTITIONING" = "day_partitioning" ]; then printf 'WRITE_APPEND'; else printf 'WRITE_TRUNCATE'; fi)

	JOB_CONFIGURATION=\
	"{\
	\"configuration\": {\
	\"load\": {\
	\"sourceFormat\": \"CSV\",\
	\"skipLeadingRows\": 1,\
	\"allowQuotedNewlines\": true,\
	\"schemaUpdateOptions\": [ \"ALLOW_FIELD_ADDITION\" ],\
	\"schema\": {\
	\"fields\": $TABLE_COLUMNS\
	},$PARTITIONING_INFO\
	\"writeDisposition\": \"$WRITE_DISPOSITION\",\
	\"destinationTable\": {\
	\"projectId\": \"$DESTINATION_PROJECT_ID\",\
	\"datasetId\": \"$DESTINATION_DATASET_ID\",\
	\"tableId\": \"$TABLE_NAME\"\
	}\
	}\
	}\
	}"

	echo "Job configuration: ${JOB_CONFIGURATION}"

	echo "Creating job..."
	JOB_URL_PRIME=$(echo $JOB_CONFIGURATION \| curl --fail -i -H "Authorization: Bearer $ACCESS_TOKEN" -H "Content-type: application/json" --data @- -X POST "https://www.googleapis.com/upload/bigquery/v2/projects/${DESTINATION_PROJECT_ID}/jobs?uploadType=resumable")

	echo "Job url prime: ${JOB_URL_PRIME}"
	JOB_URL=$(printf "${JOB_URL_PRIME}" \| perl -n -e '/^Location: (.*)/i && print $1')

	echo "Job URL: ${JOB_URL}"

	echo "Streaming virtual table into Google BigQuery..."
	curl --fail "$TABLE_URL/live/dataset" \| curl --fail -X PUT --data-binary @- ${JOB_URL%$'\r'}