zachcp · November 26, 2013 16:44
diff --git a/fasta histograms b/fasta histograms
 import glob
 from Bio import SeqIO
 import pandas as pd

 files = glob.glob('./*fasta')

 def get_size_frequencies(fasta):
    with open(fasta, 'r') as f:
        lengths = [len(rec.seq) for rec in SeqIO.parse(f,'fasta')]
    lengths = pd.Series(lengths)
    return lengths.hist()

 graphs = [get_size_frequencies(file) for file in files]

 graphs
	import glob
	from Bio import SeqIO
	import pandas as pd

	files = glob.glob('./*fasta')

	def get_size_frequencies(fasta):
	with open(fasta, 'r') as f:
	lengths = [len(rec.seq) for rec in SeqIO.parse(f,'fasta')]
	lengths = pd.Series(lengths)
	return lengths.hist()

	graphs = [get_size_frequencies(file) for file in files]

	graphs