ogyalcin · August 2, 2018 12:21
diff --git a/clean_test.py b/clean_test.py
 test['Age'].fillna(test['Age'].median(),inplace=True) # Age
 test['Fare'].fillna(test['Fare'].median(),inplace=True) # Fare
 d = {1:'1st',2:'2nd',3:'3rd'} #Pclass
 test['Pclass'] = test['Pclass'].map(d)
 test['Embarked'].fillna(test['Embarked'].value_counts().index[0], inplace=True) # Embarked
 ids = test[['PassengerId']]# Passenger Ids
 test.drop(['PassengerId','Name','Ticket','Cabin'],1,inplace=True)# Drop Unnecessary Columns
 categorical_vars = test[['Pclass','Sex','Embarked']]# Get Dummies of Categorical Variables
 dummies = pd.get_dummies(categorical_vars,drop_first=True)
 test = test.drop(['Pclass','Sex','Embarked'],axis=1)#Drop the Original Categorical Variables
 test = pd.concat([test,dummies],axis=1)#Instead, concat the new dummy variables
 #test.head()
	test['Age'].fillna(test['Age'].median(),inplace=True) # Age
	test['Fare'].fillna(test['Fare'].median(),inplace=True) # Fare
	d = {1:'1st',2:'2nd',3:'3rd'} #Pclass
	test['Pclass'] = test['Pclass'].map(d)
	test['Embarked'].fillna(test['Embarked'].value_counts().index[0], inplace=True) # Embarked
	ids = test[['PassengerId']]# Passenger Ids
	test.drop(['PassengerId','Name','Ticket','Cabin'],1,inplace=True)# Drop Unnecessary Columns
	categorical_vars = test[['Pclass','Sex','Embarked']]# Get Dummies of Categorical Variables
	dummies = pd.get_dummies(categorical_vars,drop_first=True)
	test = test.drop(['Pclass','Sex','Embarked'],axis=1)#Drop the Original Categorical Variables
	test = pd.concat([test,dummies],axis=1)#Instead, concat the new dummy variables
	#test.head()
No results found