JoseRFJuniorLLMs · January 27, 2018 05:32
diff --git a/categorical_data.py b/categorical_data.py
 # Data Preprocessing

 # Importing the libraries
 import numpy as np
 import matplotlib.pyplot as plt
 import pandas as pd

 # Importing the dataset
 dataset = pd.read_csv('Data.csv')
 X = dataset.iloc[:, :-1].values
 y = dataset.iloc[:, 3].values


 #Cuidando dados faltantes
 from sklearn.preprocessing import Imputer
 imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)
 imputer = imputer.fit(X[:, 1:3])
 X[:, 1:3] = imputer.transform(X[:, 1:3])


 # Codificação de dados categóricos
 # Codificando a Variável Independente
 from sklearn.preprocessing import LabelEncoder, OneHotEncoder
 labelencoder_X = LabelEncoder()
 X[:, 0] = labelencoder_X.fit_transform(X[:, 0])
 onehotencoder = OneHotEncoder(categorical_features = [0])
 X = onehotencoder.fit_transform(X).toarray()

 # Codificando a Variável Dependente
 labelencoder_y = LabelEncoder()
 y = labelencoder_y.fit_transform(y)
 print("X>",X)
	# Data Preprocessing

	# Importing the libraries
	import numpy as np
	import matplotlib.pyplot as plt
	import pandas as pd

	# Importing the dataset
	dataset = pd.read_csv('Data.csv')
	X = dataset.iloc[:, :-1].values
	y = dataset.iloc[:, 3].values


	#Cuidando dados faltantes
	from sklearn.preprocessing import Imputer
	imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)
	imputer = imputer.fit(X[:, 1:3])
	X[:, 1:3] = imputer.transform(X[:, 1:3])


	# Codificação de dados categóricos
	# Codificando a Variável Independente
	from sklearn.preprocessing import LabelEncoder, OneHotEncoder
	labelencoder_X = LabelEncoder()
	X[:, 0] = labelencoder_X.fit_transform(X[:, 0])
	onehotencoder = OneHotEncoder(categorical_features = [0])
	X = onehotencoder.fit_transform(X).toarray()

	# Codificando a Variável Dependente
	labelencoder_y = LabelEncoder()
	y = labelencoder_y.fit_transform(y)
	print("X>",X)
No results found