perryism · April 7, 2023 00:55
diff --git a/README.md b/README.md
diff --git a/Dockerfile b/Dockerfile
 FROM python

 RUN apt-get update
 RUN apt-get install -y openjdk-11-jdk
 RUN python -m pip install --trusted-host pypi.org --trusted-host pypi.python.org --trusted-host files.pythonhosted.org sklearn xgboost==1.0.0 sklearn2pmml ipython
 RUN wget https://github.com/jpmml/jpmml-xgboost/releases/download/1.4.0/jpmml-xgboost-executable-1.4.0.jar
 RUN python train.py
 RUN java -jar jpmml-xgboost-executable-1.3.16.jar --model-input iris.model --fmap-input Audit.fmap --target-name Adjusted --pmml-output XGBoostAudit.pmml
diff --git a/train.py b/train.py
 from sklearn import datasets
 from sklearn import metrics
 import pandas as pd
 from sklearn import svm
 from xgboost import XGBClassifier

 iris = datasets.load_iris() #dataset loading

 clf = XGBClassifier()

 df = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
                     columns=iris['feature_names'] + ['target'])

 from sklearn.model_selection  import train_test_split
 X_train, X_test, y_train, y_test = train_test_split(df[iris["feature_names"]], df['target'], test_size=0.2, random_state=42)

 clf.fit(X_train, y_train)

 clf.save_model("iris.model")

 from sklearn2pmml.xgboost import make_feature_map

 audit_fmap = make_feature_map(df, enable_categorical = False)
 audit_fmap.save("Audit.fmap")
	FROM python

	RUN apt-get update
	RUN apt-get install -y openjdk-11-jdk
	RUN python -m pip install --trusted-host pypi.org --trusted-host pypi.python.org --trusted-host files.pythonhosted.org sklearn xgboost==1.0.0 sklearn2pmml ipython
	RUN wget https://github.com/jpmml/jpmml-xgboost/releases/download/1.4.0/jpmml-xgboost-executable-1.4.0.jar
	RUN python train.py
	RUN java -jar jpmml-xgboost-executable-1.3.16.jar --model-input iris.model --fmap-input Audit.fmap --target-name Adjusted --pmml-output XGBoostAudit.pmml
	from sklearn import datasets
	from sklearn import metrics
	import pandas as pd
	from sklearn import svm
	from xgboost import XGBClassifier

	iris = datasets.load_iris() #dataset loading

	clf = XGBClassifier()

	df = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
	columns=iris['feature_names'] + ['target'])

	from sklearn.model_selection import train_test_split
	X_train, X_test, y_train, y_test = train_test_split(df[iris["feature_names"]], df['target'], test_size=0.2, random_state=42)

	clf.fit(X_train, y_train)

	clf.save_model("iris.model")

	from sklearn2pmml.xgboost import make_feature_map

	audit_fmap = make_feature_map(df, enable_categorical = False)
	audit_fmap.save("Audit.fmap")