wdecoster · June 12, 2019 13:30 · sarah872 · Jun 5, 2019 · wdecoster · Jun 5, 2019
diff --git a/aveQual-vs-summary.py b/aveQual-vs-summary.py
 from nanomath import aveQual
 from nanoplotter import scatter
 from Bio import SeqIO
 import numpy as np
 import pandas as pd
 import sys
 import gzip
 from scipy import stats
 import csv


 def main():
    datadict = getFQInput(gzip.open(sys.argv[1], 'rt'))
    with open(sys.argv[2], 'r') as summaryf:
        summary = csv.reader(summaryf, delimiter='\t')
        next(summary, None)
        for row in summary:
            if not row[11] == '0':
                datadict[row[1]].append(float(row[13]))
    scatter(
        x=pd.Series([entry[0] for entry in datadict.values()]),
        y=pd.Series([entry[1] for entry in datadict.values()]),
        names=["Calculated average read quality score", "Albacore summary derived quality score"],
        path="AveQualvsSummary",
        color="#4CB391",
        figformat="png",
        plots={"hex": 0, "kde": 1, "dot": 0, "pauvre": 0},
        stat=stats.pearsonr,
        plot_settings={})


 def getFQInput(fq):
    '''
    Get all quality scores in the dataset returned as a list of lists
    '''
    return {rec.id : [aveQual(rec.letter_annotations["phred_quality"])] for rec in SeqIO.parse(fq, "fastq")}


 if __name__ == '__main__':
    main()
	from nanomath import aveQual
	from nanoplotter import scatter
	from Bio import SeqIO
	import numpy as np
	import pandas as pd
	import sys
	import gzip
	from scipy import stats
	import csv


	def main():
	datadict = getFQInput(gzip.open(sys.argv[1], 'rt'))
	with open(sys.argv[2], 'r') as summaryf:
	summary = csv.reader(summaryf, delimiter='\t')
	next(summary, None)
	for row in summary:
	if not row[11] == '0':
	datadict[row[1]].append(float(row[13]))
	scatter(
	x=pd.Series([entry[0] for entry in datadict.values()]),
	y=pd.Series([entry[1] for entry in datadict.values()]),
	names=["Calculated average read quality score", "Albacore summary derived quality score"],
	path="AveQualvsSummary",
	color="#4CB391",
	figformat="png",
	plots={"hex": 0, "kde": 1, "dot": 0, "pauvre": 0},
	stat=stats.pearsonr,
	plot_settings={})


	def getFQInput(fq):
	'''
	Get all quality scores in the dataset returned as a list of lists
	'''
	return {rec.id : [aveQual(rec.letter_annotations["phred_quality"])] for rec in SeqIO.parse(fq, "fastq")}


	if __name__ == '__main__':
	main()
No results found