MariaLavrovskaya · June 14, 2019 11:57
diff --git a/MLR_movies_6.py b/MLR_movies_6.py
 #Treating categorical variables with One-hot-encoding
 from sklearn import preprocessing
 le = preprocessing.LabelEncoder()


 # LabelEncoder for a number of columns
 class MultiColumnLabelEncoder:

    def __init__(self, columns = None):
        self.columns = columns # list of column to encode
    def fit(self, X, y=None):
        return self
    def transform(self, X):
        '''
        Transforms columns of X specified in self.columns using
        LabelEncoder(). If no columns specified, transforms all
        columns in X.
        '''

        output = X.copy()

        if self.columns is not None:
            for col in self.columns:
                output[col] = LabelEncoder().fit_transform(output[col])
        else:
            for colname, col in output.iteritems():
                output[colname] = LabelEncoder().fit_transform(col)

        return output
    def fit_transform(self, X, y=None):
        return self.fit(X, y).transform(X)

 le = MultiColumnLabelEncoder()
 X_train_le = le.fit_transform(X)
	#Treating categorical variables with One-hot-encoding
	from sklearn import preprocessing
	le = preprocessing.LabelEncoder()


	# LabelEncoder for a number of columns
	class MultiColumnLabelEncoder:

	def __init__(self, columns = None):
	self.columns = columns # list of column to encode
	def fit(self, X, y=None):
	return self
	def transform(self, X):
	'''
	Transforms columns of X specified in self.columns using
	LabelEncoder(). If no columns specified, transforms all
	columns in X.
	'''

	output = X.copy()

	if self.columns is not None:
	for col in self.columns:
	output[col] = LabelEncoder().fit_transform(output[col])
	else:
	for colname, col in output.iteritems():
	output[colname] = LabelEncoder().fit_transform(col)

	return output
	def fit_transform(self, X, y=None):
	return self.fit(X, y).transform(X)

	le = MultiColumnLabelEncoder()
	X_train_le = le.fit_transform(X)