Week 8.7 Relation between K-means and GMM

K-means 와 GMM 의 관계를 좀더 수식적으로 알아보자.

Covariance Matrix Σk 를 identity matrix 라 가정해보자. 즉 개별 dimenstion 상으로 분산은 있고, corrleation은 없다는 의미이다. 분산은 e를 통해 분산의 정도를 조절할수 있다.

위의 식의 분모는 K에 대한 summation 이기 때문에 independant 하지만 분모는 개별 k 마다 경쟁을 한다.

e가 점점 줄어들어 나갈때 , exp안의 항이 0에 가까워 질수록 점점 내려간다. 𝝁𝑘 가 크면 더빨리 줄어들고, 𝝁𝑘가 작으면 천천히 줄어든다. exp 에 의해 값들이 0으로 수렴하여도 , 𝝁𝑘 이 제일 작은 cluster는 0에 가까워 져도 여전히 값을 지니게 된다. (느리게 이동하기 때문이다.) 그 특정 cluster에 대한 assignment probability가 dominant 해진다.

즉 이것은 e가 0으로 갈때 soft clustering 의 GMM 이 hard clustering 의 K-means 로 가고 있다는 의미이다. GMM을 통해 K-means algorithm을 할수 있다는 의미이다.

'머신러닝 > 문일철 교수님 강의 정리 (인공지능및기계학습개론)' 카테고리의 다른 글

Week 8.9 Derivation of EM Algorithm (0)	2019.10.11
Week 8.8 Fundamentals of the EM Algorithm (0)	2019.10.10
Week 8.5 Gaussian Mixture Model (0)	2019.10.07
Week 8.4 Multivariate Gaussian Distribution (0)	2019.10.03
Week 8.3 Multinomial Distribution (0)	2019.10.03

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

초보아기 아빠 머신러닝 공부 블로그