rkdgusrn1212 · June 8, 2022 01:06
diff --git a/k-means_clustering.py b/k-means_clustering.py
 from sklearn.cluster import KMeans

 #features 컬럼들을 평균 0, 표준편차 1로 표준화함.
 X_scaled = X.loc[:, features]#[:]전채 행에서 features열만 가지고 군집화함.
 X_scaled = (X_scaled - X_scaled.mean(axis=0)) / X_scaled.std(axis=0)#각 열에서의 행들의 평균, 행들의 표준편차

 #n_cluster는 군집 개수, n_init은 다른 랜덤 centeroid를 가지고 알고리즘을 수행될 횟수로 그 중 가장 군집화가 잘된 결과를 반환한다.
 kmeans = KMeans(n_clusters=10, n_init=10)
 X["Cluster"] = kmeans.fit_predict(X_scaled)#군집화 정보를 다시 학습 데이터에 넣어준다.
	from sklearn.cluster import KMeans

	#features 컬럼들을 평균 0, 표준편차 1로 표준화함.
	X_scaled = X.loc[:, features]#[:]전채 행에서 features열만 가지고 군집화함.
	X_scaled = (X_scaled - X_scaled.mean(axis=0)) / X_scaled.std(axis=0)#각 열에서의 행들의 평균, 행들의 표준편차

	#n_cluster는 군집 개수, n_init은 다른 랜덤 centeroid를 가지고 알고리즘을 수행될 횟수로 그 중 가장 군집화가 잘된 결과를 반환한다.
	kmeans = KMeans(n_clusters=10, n_init=10)
	X["Cluster"] = kmeans.fit_predict(X_scaled)#군집화 정보를 다시 학습 데이터에 넣어준다.