jthomerson · April 24, 2017 14:50 · jthomerson · Apr 24, 2017 · holmberd · May 4, 2017
diff --git a/delete-all-cloudsearch-documents.sh b/delete-all-cloudsearch-documents.sh
 #!/bin/bash

 # This script will delete *all* documents in a CloudSearch domain.
 # USE WITH EXTREME CAUTION

 # Note: depends on the AWS CLI SDK being installed, as well as jq
 # For jq, see: https://stedolan.github.io/jq/ and https://jqplay.org/

 if [[ ! $# -eq 2 || $1 != "--doc-domain" || ! $2 =~ ^https://.*$ ]]; then
   echo "Must define --doc-domain argument (e.g. --doc-domain https://somedomain.aws.com)";
   exit 1;
 fi

 CS_DOMAIN=$2
 TMP_DELETE_FILE=/tmp/delete-all-cloudsearch-documents.json
 TMP_RESULTS_FILE=/tmp/delete-all-cloudsearch-documents-tmp-results.json

 while [ 1 -eq 1 ]; do
   aws cloudsearchdomain search \
      --endpoint-url=$CS_DOMAIN \
      --size=10000 \
      --query-parser=structured \
      --search-query="matchall" > ${TMP_RESULTS_FILE}

   cat ${TMP_RESULTS_FILE} | jq '[.hits.hit[] | {type: "delete", id: .id}]' > ${TMP_DELETE_FILE}

   CNT_TOTAL=$(cat ${TMP_RESULTS_FILE} | jq '.hits.found')
   CNT_DOCS=$(cat ${TMP_DELETE_FILE} | jq '. | length')

   if [[ $CNT_DOCS -gt 0 ]]; then
      echo "About to delete ${CNT_DOCS} documents of ${CNT_TOTAL} total in index"

      aws cloudsearchdomain upload-documents \
         --endpoint-url=$CS_DOMAIN \
         --content-type='application/json' \
         --documents=${TMP_DELETE_FILE}
   else
      echo "No more docs to delete"
      exit 0
   fi
 done