K平均算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k小于n。它与处理混合。正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。k平均聚类发明于1956年,该算法最常见的形式是采用被称为劳埃德算法。
介绍
k-means Algorithm算法是一个聚类算法,把的对象根据他们的属性分为个分割,。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。假设有个群组是群组内所有元素的重心,或叫中心点。 发明历史
平均聚类发明于1956年,该算法最常见的形式是采用被称为劳埃德算法(Lloyd algorithm)的迭代式改进探索法。劳埃德算法首先把输入点分成k个初始化分组,可以是随机的或者使用一些启发式数据。然后计算每组的中心点,根据中心点的位置把对象分到离它最近的中心,重新确定分组。继续重复不断地计算中心并重新分组,直到收敛,即对象不再改变分组(中心点位置不再改变)。