emrepun · December 5, 2019 22:59
diff --git a/pre_processing.py b/pre_processing.py
 import numpy as np
 import pandas as pd
 from nltk.corpus import stopwords

 df = pd.read_csv('city_data.csv')

 def clear(city):
    city = city.lower()
    city = city.split()
    city_keywords = [word for word in city if word not in stopwords.words('english')]
    
    merged_city = " ".join(city_keywords)
    return merged_city

 for index, row in df.iterrows():
    clear_desc = clear(row['description'])
    df.at[index, 'description'] = clear_desc

 updated_dataset = df.to_csv('city_data_cleared.csv')
	import numpy as np
	import pandas as pd
	from nltk.corpus import stopwords

	df = pd.read_csv('city_data.csv')

	def clear(city):
	city = city.lower()
	city = city.split()
	city_keywords = [word for word in city if word not in stopwords.words('english')]

	merged_city = " ".join(city_keywords)
	return merged_city

	for index, row in df.iterrows():
	clear_desc = clear(row['description'])
	df.at[index, 'description'] = clear_desc

	updated_dataset = df.to_csv('city_data_cleared.csv')