聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。

k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。

先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下任何一个:

1、没有(或最小数目)对象被重新分配给不同的聚类。

2、没有(或最小数目)聚类中心再发生变化。

3、误差平方和局部最小。

伪代码

选择k个点作为初始质心。

repeat 将每个点指派到最近的质心,形成k个簇 重新计算每个簇的质心 until 质心不发生变化

k均值聚类是使用最大期望算法(Expectation-Maximization algorithm)求解的高斯混合模型(Gaussian Mixture Model, GMM)在正态分布的协方差为单位矩阵,且隐变量的后验分布为一组狄拉克δ函数时所得到的特例[1] 。

相关查询: 在某些方面
最新查询:翡翠裙边汤 见证者 二年级学生 Magonari attribution 冈山县 Association 大埔七约 Ahonosakata 1990.2 独联体 世俗化 阶梯式 孩子王 %E4%B8%B0%E9%A1%BA%E5%8E%BF 国际海峡 RUEI Ginzburg 给你一身鸡皮疙瘩 neutrophilicgranulocyte 五万人 辽宁省道教协会 马塞尔·赛普 回顾展 李强 业主权益 Cucaracha 恐龙对大蟒续集 思想包袱 2012考研政治重点剖析28题 捡起来 糙蒴凤尾藓 红烧石斑鱼 林明鲜 博帕尔 西游Q记 圣约翰学院 四大金刚 电子秤 合格证书 建筑体 为袁绍檄豫州文 Scholars 控制下 羊城夜市图 协作组 时不时 %E7%B4%A7%E6%8E%A5%E8%91%97 农工贸 足球场 微电脑 湿度 up-to-date 交往史 环球旅行 日本电信电话公社 得意门生 武汉交通管理干部学院 她的 天方方便面 战神加速器 活学活用博弈论:如何利用博弈论在竞争中获胜 今古传奇 不夜城 university 圣母子和圣安妮 Irresistible 意式细面 埃菲尔 critical %25E7%259F%25A5%25E5%2590%258D%25E5%25BA%25A6 内部事务 先头部队 SimMechanics hello!+project %E5%88%97%E6%94%AF%E6%95%A6%E5%A3%AB%E7%99%BB 彩虹桉树 1897.11.11 优越感 k-means
友情链接: 知道 电影 百科 好搜 问答 微信 值得买 巨便宜 天天特价 洛阳汽车脚垫 女装 女鞋 母婴 内衣 零食 美妆 汽车 油价 郑州 北京 上海 广州 深圳 杭州 南京 苏州 武汉 天津 重庆 成都 大连 宁波 济南 西安 石家庄 沈阳 南阳 临沂 邯郸 保定 温州 东莞 洛阳 周口 青岛 徐州 赣州 菏泽 泉州 长春 唐山 商丘 南通 盐城 驻马店 佛山 衡阳 沧州 福州 昆明 无锡 南昌 黄冈 遵义
© 2026 haodianxin 百科 豫ICP备14030218号-3 消耗时间:0.046秒 内存0.84MB 2025-09-26 04:43:42