所谓k均值聚类方法是一种无监督的学习算法,它能用已知类数的数据聚类和预测。 在k均值算法中 1、首先要手动输入一个聚类的数目K(即你想将数据总共分成多少类)。然后由计算机(随机的)或人工的设定K个聚类中心Z1(1), Z2(1), ..., Zk(1)。 2、计算任意两点之间的距离平方和 3、通过2的计算找到新的聚类中心Z1(j+1),Z2(j+1),...,Zk(j+1) 4、如果新的聚类中心和以前一样,终止,否则,goto 2。 即该算法首先要人为的给定一个聚类的数目k,然后不断的通过计算距离修正聚类中心。 该算法还有一种改进算法叫ISODATA法 你可以参考一下《数据挖掘:概念与技术》,韩家伟著 |
|