mmterpstra · November 23, 2016 09:00
diff --git a/README.md b/README.md
diff --git a/htseq-count.nodup.sh b/htseq-count.nodup.sh
 #!/bin/bash
 #SBATCH --job-name=Htseq_nodup
 #SBATCH --output=logs/Htseq_%j.out
 #SBATCH --error=logs/Htseq_%j.err
 #SBATCH --partition=duo-pro
 #SBATCH --time=10:00:00
 #SBATCH --cpus-per-task 2
 #SBATCH --mem 8gb
 #SBATCH --nodes 1
 #SBATCH --open-mode=append
 #SBATCH --export=NONE
 #SBATCH --get-user-env=L

 set -e;
 set -x;
 set -o pipefail;

 #in
 inBam=$1
 inGFF=$2
 outTsv=$3

 #out
 outDir=$(dirname $outTsv)
 doneBase=${outDir}/$(basename ${outTsv} .bam)
 doneFile=$doneBase.$SLURM_JOB_ID.done
 if [ "${outTsv}" != "" ] && [ "$doneBase" != ""]; then
 	if ls ${outBam}/ 1> /dev/null 2>&1 && ls  $doneBase.*.done 1> /dev/null 2>&1 ; then
    		echo "## "$(date)" ##  $0 Finished job exiting."
        	exit 0
 	else
 		echo "## "$(date)" ##  $0 Unfinished job restarting." 
 		if ls ${outTsv}* 1> /dev/null 2>&1 ; then
 			echo rm -rv ${outTsv}* >> cleanup.sh
 		fi
 	        if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
 	                echo rm -rv ${doneBase}.*.done >> cleanup.sh
 	        fi
 	fi
 else
 	echo "define input"
 fi
 echo "## "$(date)" ##  $0 Started "

 mkdir -p $outDir;

 ml SAMtools/1.3.1-foss-2015b
 ml HTSeq/0.6.1p1-foss-2015b-Python-2.7.11

 ( samtools view -h -F 1024 ${inBam} | htseq-count -m union -s yes -t exon -i gene_id - ${inGFF} > ${outTsv} )


 touch $doneFile
diff --git a/htseq-count.sh b/htseq-count.sh
 #!/bin/bash
 #SBATCH --job-name=Htseq
 #SBATCH --output=logs/Htseq_%j.out
 #SBATCH --error=logs/Htseq_%j.err
 #SBATCH --partition=duo-pro
 #SBATCH --time=10:00:00
 #SBATCH --cpus-per-task 2
 #SBATCH --mem 8gb
 #SBATCH --nodes 1
 #SBATCH --open-mode=append
 #SBATCH --export=NONE
 #SBATCH --get-user-env=L

 set -e;
 set -x;
 set -o pipefail;

 #in
 inBam=$1
 inGFF=$2
 outTsv=$3

 #out
 outDir=$(dirname $outTsv)
 doneBase=${outDir}/$(basename ${outTsv} .bam)
 doneFile=$doneBase.$SLURM_JOB_ID.done

 #this is for control of input or else it will get really easy to remove your entire data 
 if [ "${outTsv}" != "" ] && [ "$doneBase" != ""]; then
  #This checks the output location(s) and exits if already present.
  # (Then you can restart all of your jobs again instead of looking up the
  # specific job you need to run, when a single job has failed)
 	if ls ${outBam}/ 1> /dev/null 2>&1 && ls  $doneBase.*.done 1> /dev/null 2>&1 ; then
    		echo "echo "## "$(date)" ##  $0 Finished job exiting."
        	exit 0
 	else
 		echo "## "$(date)" ##  $0 Unfinished job restarting." 
 		if ls ${outTsv}* 1> /dev/null 2>&1 ; then
 			echo rm -rv ${outTsv}* >> cleanup.sh
 		fi
 	        if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
 	                echo rm -rv ${doneBase}.*.done >> cleanup.sh
 	        fi
 	fi
 else
 	echo "define input"
 fi
 echo "## "$(date)" ##  $0 Started "

 mkdir -p $outDir;

 ml SAMtools/1.3.1-foss-2015b
 ml HTSeq/0.6.1p1-foss-2015b-Python-2.7.11

 ( samtools view -h ${inBam} | htseq-count -m union -s yes -t exon -i gene_id - ${inGFF} > ${outTsv} )


 touch $doneFile
diff --git a/sortbyname.sh b/sortbyname.sh
 #!/bin/bash
 #SBATCH --job-name=SortSam
 #SBATCH --output=logs/SortSam_%j.out
 #SBATCH --error=logs/SortSam_%j.err
 #SBATCH --partition=duo-pro
 #SBATCH --time=10:00:00
 #SBATCH --cpus-per-task 2
 #SBATCH --mem 8gb
 #SBATCH --nodes 1
 #SBATCH --open-mode=append
 #SBATCH --export=NONE
 #SBATCH --get-user-env=L

 set -e;
 set -x;
 set -o pipefail;

 #in
 inBam=$1
 outBam=$2

 #out
 outDir=$(dirname $outBam)
 doneBase=${outDir}/$(basename ${outBam} .bam)
 doneFile=$doneBase.$SLURM_JOB_ID.done
 if [ "${outBam}" != "" ] && [ "$doneBase" != ""]; then
 	if ls ${outBam}/ 1> /dev/null 2>&1 && ls  $doneBase.*.done 1> /dev/null 2>&1 ; then
    		echo "## "$(date)" ##  $0 Finished job exiting."
        	exit 0
 	else
 		echo "## "$(date)" ##  $0 Unfinished job restarting." 
 		if ls ${outBam}* 1> /dev/null 2>&1 ; then
 			echo rm -rv ${outBam}* >> cleanup.sh
 		fi
 	        if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
 	                echo rm -rv ${doneBase}.*.done >> cleanup.sh
 	        fi
 	fi
 else
 	echo "define input"
 fi
 echo "## "$(date)" ##  $0 Started "

 mkdir -p $outDir;

 ml picard/1.140-foss-2015b-Java-1.8.0_45
 java -XX:ParallelGCThreads=2 -Xmx8g -jar ${EBROOTPICARD}/picard.jar SortSam SORT_ORDER=queryname I=$1 O=$2

 touch $doneFile
	#!/bin/bash
	#SBATCH --job-name=Htseq_nodup
	#SBATCH --output=logs/Htseq_%j.out
	#SBATCH --error=logs/Htseq_%j.err
	#SBATCH --partition=duo-pro
	#SBATCH --time=10:00:00
	#SBATCH --cpus-per-task 2
	#SBATCH --mem 8gb
	#SBATCH --nodes 1
	#SBATCH --open-mode=append
	#SBATCH --export=NONE
	#SBATCH --get-user-env=L

	set -e;
	set -x;
	set -o pipefail;

	#in
	inBam=$1
	inGFF=$2
	outTsv=$3

	#out
	outDir=$(dirname $outTsv)
	doneBase=${outDir}/$(basename ${outTsv} .bam)
	doneFile=$doneBase.$SLURM_JOB_ID.done
	if [ "${outTsv}" != "" ] && [ "$doneBase" != ""]; then
	if ls ${outBam}/ 1> /dev/null 2>&1 && ls $doneBase.*.done 1> /dev/null 2>&1 ; then
	echo "## "$(date)" ## $0 Finished job exiting."
	exit 0
	else
	echo "## "$(date)" ## $0 Unfinished job restarting."
	if ls ${outTsv}* 1> /dev/null 2>&1 ; then
	echo rm -rv ${outTsv}* >> cleanup.sh
	fi
	if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
	echo rm -rv ${doneBase}.*.done >> cleanup.sh
	fi
	fi
	else
	echo "define input"
	fi
	echo "## "$(date)" ## $0 Started "

	mkdir -p $outDir;

	ml SAMtools/1.3.1-foss-2015b
	ml HTSeq/0.6.1p1-foss-2015b-Python-2.7.11

	( samtools view -h -F 1024 ${inBam} \| htseq-count -m union -s yes -t exon -i gene_id - ${inGFF} > ${outTsv} )


	touch $doneFile
	#!/bin/bash
	#SBATCH --job-name=Htseq
	#SBATCH --output=logs/Htseq_%j.out
	#SBATCH --error=logs/Htseq_%j.err
	#SBATCH --partition=duo-pro
	#SBATCH --time=10:00:00
	#SBATCH --cpus-per-task 2
	#SBATCH --mem 8gb
	#SBATCH --nodes 1
	#SBATCH --open-mode=append
	#SBATCH --export=NONE
	#SBATCH --get-user-env=L

	set -e;
	set -x;
	set -o pipefail;

	#in
	inBam=$1
	inGFF=$2
	outTsv=$3

	#out
	outDir=$(dirname $outTsv)
	doneBase=${outDir}/$(basename ${outTsv} .bam)
	doneFile=$doneBase.$SLURM_JOB_ID.done

	#this is for control of input or else it will get really easy to remove your entire data
	if [ "${outTsv}" != "" ] && [ "$doneBase" != ""]; then
	#This checks the output location(s) and exits if already present.
	# (Then you can restart all of your jobs again instead of looking up the
	# specific job you need to run, when a single job has failed)
	if ls ${outBam}/ 1> /dev/null 2>&1 && ls $doneBase.*.done 1> /dev/null 2>&1 ; then
	echo "echo "## "$(date)" ## $0 Finished job exiting."
	exit 0
	else
	echo "## "$(date)" ## $0 Unfinished job restarting."
	if ls ${outTsv}* 1> /dev/null 2>&1 ; then
	echo rm -rv ${outTsv}* >> cleanup.sh
	fi
	if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
	echo rm -rv ${doneBase}.*.done >> cleanup.sh
	fi
	fi
	else
	echo "define input"
	fi
	echo "## "$(date)" ## $0 Started "

	mkdir -p $outDir;

	ml SAMtools/1.3.1-foss-2015b
	ml HTSeq/0.6.1p1-foss-2015b-Python-2.7.11

	( samtools view -h ${inBam} \| htseq-count -m union -s yes -t exon -i gene_id - ${inGFF} > ${outTsv} )


	touch $doneFile
	#!/bin/bash
	#SBATCH --job-name=SortSam
	#SBATCH --output=logs/SortSam_%j.out
	#SBATCH --error=logs/SortSam_%j.err
	#SBATCH --partition=duo-pro
	#SBATCH --time=10:00:00
	#SBATCH --cpus-per-task 2
	#SBATCH --mem 8gb
	#SBATCH --nodes 1
	#SBATCH --open-mode=append
	#SBATCH --export=NONE
	#SBATCH --get-user-env=L

	set -e;
	set -x;
	set -o pipefail;

	#in
	inBam=$1
	outBam=$2

	#out
	outDir=$(dirname $outBam)
	doneBase=${outDir}/$(basename ${outBam} .bam)
	doneFile=$doneBase.$SLURM_JOB_ID.done
	if [ "${outBam}" != "" ] && [ "$doneBase" != ""]; then
	if ls ${outBam}/ 1> /dev/null 2>&1 && ls $doneBase.*.done 1> /dev/null 2>&1 ; then
	echo "## "$(date)" ## $0 Finished job exiting."
	exit 0
	else
	echo "## "$(date)" ## $0 Unfinished job restarting."
	if ls ${outBam}* 1> /dev/null 2>&1 ; then
	echo rm -rv ${outBam}* >> cleanup.sh
	fi
	if ls ${doneBase}.*.done 1> /dev/null 2>&1 ; then
	echo rm -rv ${doneBase}.*.done >> cleanup.sh
	fi
	fi
	else
	echo "define input"
	fi
	echo "## "$(date)" ## $0 Started "

	mkdir -p $outDir;

	ml picard/1.140-foss-2015b-Java-1.8.0_45
	java -XX:ParallelGCThreads=2 -Xmx8g -jar ${EBROOTPICARD}/picard.jar SortSam SORT_ORDER=queryname I=$1 O=$2

	touch $doneFile