njs03332 / ml_study

3 stars 0 forks source link

2022/09/15~2022/09/22 #43

Open danbi5228 opened 1 year ago

danbi5228 commented 1 year ago
image
njs03332 commented 1 year ago

9.1.2 k-평균의 한계

danbi5228 commented 1 year ago

9.1.1 k-평균

최적의 클러스터 개수 찾기

givitallugot commented 1 year ago

k-평균 속도 개선과 미니배치 k-평균

minibatch_kmeans = MiniBatchKMeans(n_clusters=5, random_state=42) minibatch_kmeans.fit(X)



- 미니배치 K-평균 알고리즘이 일반 K-평균 알고리즘보다 이너셔가 조금 더 안 좋지만, 속도는 매우 빠름, 특히 클러스터 개수가 증가할 수록.
  - 이너셔(Inertia): K-mean 클러스터링의 성능 지표, 각 샘플과 가장 가까운 센트로이드 사이의 평균 제곱 거리를 측정한 수치
<img width=550 src=https://user-images.githubusercontent.com/50584633/191716008-2fa924aa-3615-4bbd-98b8-f719d0edcd7e.png>