(2014-07-02 14:26:11) 记得前一篇博文写过关于K-MEANS的内容,K-MEANS顾名思义K-均值,通过计算一类记录的均值来代表该类,但是受异常值或极端值的影响比较大,这里介绍另外一种算法K-medodis。 看起来和K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值,在 K-medoids算法中,我们将从当前cluster 中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小——作为中心点。 K-MEANS算法的缺点: 这儿选取一个对象叫做mediod来代替上面的中心的作用,这样的一个medoid就标识了这个类。 K-MEDODIS的具体流程如下: |
|