Eli Draizen edraizen

Postdoc @ UCSF. Interested in parasitology, protein structure, evolution.

edraizen / pfam_to_uniprot.py

Created January 28, 2016 17:57

	from collections import defaultdict
	import requests
	from bs4 import beautifulsoup
	num_sequences = defaultdict(int)
	with open("/Users/edraizen/Dropbox/Membrane-Proteins/data/pfam-uniprot/pfam-polytopic_201601.txt") as pfam_f:
	pfam_f.next()
	for line in pfam_f:
	pfam = line.split()[1]
	r = requests.get("http://pfam.xfam.org/family/{}#tabview=tab3".format(pfam))
	soup = BeautifulSoup(r.text)