Pranjal Saxena pranjalAI

Data Scientist

pranjalAI / generator to tflite.py

Created October 26, 2020 13:44

	# Convert the model.
	converter = tf.lite.TFLiteConverter.from_keras_model(generator)
	tflite_model = converter.convert()

pranjalAI / ResidualSep.py

Created October 27, 2020 10:08

	class ResidualSep(nn.Module):
	def __init__(self, channels, dilation=1):
	super().__init__()

	self.blocks = nn.Sequential(
	nn.ReLU(),
	nn.ReflectionPad2d(dilation),
	nn.Conv2d(channels, channels, kernel_size=3, stride=1,
	padding=0, dilation=dilation,
	groups=channels, bias=False),

pranjalAI / residualhourglass.py

Created October 27, 2020 10:20

	class ResidualHourglass(nn.Module):
	def __init__(self, channels, mult=0.5):
	super().__init__()

	hidden_channels = int(channels * mult)

	self.blocks = nn.Sequential(
	nn.ReLU(),
	# Downsample
	nn.ReflectionPad2d(1),

pranjalAI / transform.py

Created October 27, 2020 10:34

	class TransformerNet(torch.nn.Module):
	def __init__(self, width=8):
	super().__init__()

	self.blocks = nn.Sequential(
	nn.ReflectionPad2d(1),
	nn.Conv2d(3, width, kernel_size=3, stride=1, padding=0, bias=False),
	nn.BatchNorm2d(width, affine=True),
	ResidualHourglass(channels=width),
	ResidualHourglass(channels=width),

pranjalAI / pub list.py

Created November 28, 2020 17:51

	links=[]
	pubs=["swlh",'illumination','analytics-vidhya','better-advice','the-post-grad-survival-guide','the-ascent']
	stop_words = set(stopwords.words('english'))
	for pub in pubs:
	links.append("https://medium.com/"+str(pub)+"/latest")

pranjalAI / getting_article_urls.py

Created November 28, 2020 17:54

	pub_links={}
	for link in links:
	response = requests.get(link)
	soup = BeautifulSoup(response.text, "lxml" )
	data = soup.find('div', class_ = 'js-postListHandle')
	my_data=data.find('div',class_ = 'js-postListHandle')
	final_data=my_data.find_all('div',{'class':'postArticle-content'})
	Alinks=[]
	for Alink in final_data:
	href=Alink.find("a").get('href').split("?")[0]

pranjalAI / getting_data.py

Created November 28, 2020 18:01

	response = requests.get(data_link)
	soup = BeautifulSoup(response.text, "lxml" )
	para=soup.find_all("p")
	head1=soup.find_all("h1")
	head2=soup.find_all("h2")
	head3=soup.find_all("h3")

pranjalAI / merging.py

Created November 28, 2020 18:04

pranjalAI / cleaning mechanism.py

Created November 28, 2020 18:05

	doc = processArti(content)
	doc = tokenize(doc)
	doc = [wd for wd in doc if wd not in stop_words]
	doc = sorted(set(doc))
	doc = " ".join(doc)
	doc = tokens(doc)
	doc = removeNum(doc)
	doc = [i for i in doc if not i==""]
	doc = " ".join(doc)

pranjalAI / applying to all.py

Created November 28, 2020 18:08

	for pub in pubs:
	for data_link in pub_links[pub]:
	doc=get_doc(data_link)
	to_add = pd.DataFrame({"publication":[pub],"article":[doc]})
	data=data.append(to_add, ignore_index = True)