cigrainger’s gists

cigrainger / gist:8856a05109fbf766604d

Created June 5, 2014 20:06

	import re, string, sys, nltk
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')

	def get_wordnet_pos(treebank_tag):
	if treebank_tag.startswith('J'):

cigrainger / gist:92d982e8083edf518ce0

Created June 6, 2014 10:19

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):

cigrainger / gist:073897770288bec692da

Created June 6, 2014 10:33

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):

cigrainger / gist:aa3381f1570cb3dcf6ca

Created June 6, 2014 13:15

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):

cigrainger / gist:11fc615aed9965ba29c0

Created June 6, 2014 13:19

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):

cigrainger / gist:c37a58a59bda2a575bb9

Created June 8, 2014 10:28

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')
	shortword = re.compile(r'\W*\b\w{1,2}\b')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}

cigrainger / gist:e20ec343be89c944616b

Created June 9, 2014 10:13

	import re, string, sys, nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()
	pattern=re.compile(r'[^a-zA-Z ]')
	shortword = re.compile(r'\W*\b\w{1,2}\b')

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}

cigrainger / gist:d76a067a2175e715f245

Created June 10, 2014 17:35

	import nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed
	from functools32 import lru_cache

	lmtzr = WordNetLemmatizer()
	lemmatize = lru_cache(maxsize=100000)(lmtzr.lemmatize)

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}

cigrainger / gist:9a0af7d5629a8c983c91

Created June 12, 2014 07:12

	import nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):
	return tag_to_type.get(treebank_tag[:1], wordnet.NOUN)

cigrainger / gist:dfbb5eb549d52064062c

Created June 12, 2014 07:12

	import nltk, timeit
	from nltk.stem.wordnet import WordNetLemmatizer
	from nltk.corpus import wordnet
	from joblib import Parallel, delayed

	lmtzr = WordNetLemmatizer()

	tag_to_type = {'J': wordnet.ADJ, 'V': wordnet.VERB, 'R': wordnet.ADV}
	def get_wordnet_pos(treebank_tag):
	return tag_to_type.get(treebank_tag[:1], wordnet.NOUN)

Christopher Grainger cigrainger