Audhi Aprilliant audhiaprilliant

🎯

Focusing

Eat Sleep Code Repeat

audhiaprilliant / machine_learning_deployment_11.py

Created May 16, 2022 12:09

End to end machine learning model deployment using flask

	# Data partitioning

	# Unique values of Loan_Status
	df_concat['Loan_Status'].value_counts()

	# Training set
	df_train = df_concat[df_concat['Loan_Status'].isin([0, 1])].reset_index(drop = True)
	print('Dimension data: {} rows and {} columns'.format(len(df_train), len(df_train.columns)))
	df_train.head()

audhiaprilliant / machine_learning_deployment_10.py

Created May 16, 2022 12:08

End to end machine learning model deployment using flask

	# One hot encoder

	# Add new column of Loan_Status with 999 in testing data
	df_test['Loan_Status'] = 999
	# Concat the training and testing data
	df_concat = pd.concat(objs = [df_train , df_test], axis = 0)

	# Drop the column of Loan_ID
	df_concat.drop(columns = ['Loan_ID'], inplace = True)

audhiaprilliant / machine_learning_deployment_9.py

Created May 16, 2022 12:06

End to end machine learning model deployment using flask

	# The distribution of loan amount by loan status

	# Slice the columns
	df_viz_5 = df_train[['LoanAmount', 'Loan_Status']].reset_index(drop = True)
	# Map the loan status
	df_viz_5['Loan_Status'] = df_viz_5['Loan_Status'].map(
	{
	0: 'Not default',
	1: 'Default'
	}

audhiaprilliant / machine_learning_deployment_8.py

Created May 16, 2022 12:04

End to end machine learning model deployment using flask

	# The distribution of applicant incomes by loan status

	# Slice the columns
	df_viz_4 = df_train[['ApplicantIncome', 'Loan_Status']].reset_index(drop = True)
	# Map the loan status
	df_viz_4['Loan_Status'] = df_viz_4['Loan_Status'].map(
	{
	0: 'Not default',
	1: 'Default'
	}

audhiaprilliant / machine_learning_deployment_7.py

Created May 16, 2022 12:04

End to end machine learning model deployment using flask

	# Number of customers by loan status and educations

	# Data aggregation between loan status and dependents
	df_viz_3 = df_train.groupby(['Loan_Status', 'Education'])['Loan_ID'].count().reset_index(name = 'Total')
	# Map the loan status
	df_viz_3['Loan_Status'] = df_viz_3['Loan_Status'].map(
	{
	0: 'Not default',
	1: 'Default'
	}

audhiaprilliant / machine_learning_deployment_6.py

Created May 16, 2022 12:01

End to end machine learning model deployment using flask

	# Number of customers by loan status and the dependents

	# Data aggregation between loan status and dependents
	df_viz_2 = df_train.groupby(['Loan_Status', 'Dependents'])['Loan_ID'].count().reset_index(name = 'Total')
	# Map the loan status
	df_viz_2['Loan_Status'] = df_viz_2['Loan_Status'].map(
	{
	0: 'Not default',
	1: 'Default'
	}

audhiaprilliant / machine_learning_deployment_5.py

Created May 16, 2022 11:59

End to end machine learning model deployment using flask

	# Number of customers by loan status

	# Data aggregation between default and not default customers
	df_viz_1 = df_train.groupby(['Loan_Status'])['Loan_ID'].count().reset_index(name = 'Total')
	# Map the loan status
	df_viz_1['Loan_Status'] = df_viz_1['Loan_Status'].map(
	{
	0: 'Not default',
	1: 'Default'
	}

audhiaprilliant / machine_learning_deployment_4.py

Created May 16, 2022 11:53

End to end machine learning model deployment using flask

	# -------------------- TESTING SET --------------------
	# Data frame metadata
	df_test.info()

	# Change column types
	df_test = df_test.astype({'Credit_History': object})
	df_test.select_dtypes(include = ['object']).dtypes

	# Summary statistics of categorical columns
	for i in df_test.select_dtypes('object').columns:

audhiaprilliant / machine_learning_deployment_3.py

Last active May 16, 2022 11:53

End to end machine learning model deployment using flask

	# -------------------- TRAINING SET --------------------
	# Data frame metadata
	df_train.info()

	# Change column types
	df_train = df_train.astype({'Credit_History': object, 'Loan_Status': int})
	df_train.select_dtypes(include = ['object']).dtypes

	# Summary statistics of categorical columns
	for i in df_train.select_dtypes('object').columns:

audhiaprilliant / machine_learning_deployment_2.py

Created May 16, 2022 11:40

End to end machine learning model deployment using flask

	# -------------------- TRAINING SET --------------------
	# Import the training set
	df_train = pd.read_csv(
	filepath_or_buffer = 'https://raw.githubusercontent.com/dphi-official/Datasets/master/Loan_Data/loan_train.csv',
	usecols = [i for i in range(1, 14)]
	)

	# Data dimension
	print('Data dimension: {} rows and {} columns'.format(len(df_train), len(df_train.columns)))
	df_train.head()