K-means聚类算法研究综述
作者:
作者单位:

作者简介:

王森(1969—),男,教授,硕士研究生导师,研究方向为计算机应用开发。E-mail:515613251@qq.com。

通讯作者:

中图分类号:

TP301.6

基金项目:

江西省自然科学基金项目(2019ZACBL20010)


Review on K-means Clustering Algorithm
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    聚类分析是数据挖掘的重要技术,而在 5G 时代,海量的数据维度高、数据集大,利用 K-means 算法易受离群点的影响, 且 K 值、初始聚类中心的选取影响聚类结果的稳定性和准确率,甚至导致聚类陷入局部最优,对 K-means 算法的改进受到众多研究者的关注。 主要对 K-means 聚类的研究现状进行归纳总结。 首先,介绍 K-means 算法的思想原理;其次,针对初始聚类中心点的选取、K 值确定、 离群点对现有改进算法进行基于密度和距离的分类总结, 并对各个改进算法的优势和缺陷进行分析;最后对 K-means 算法未来可能的研究方向和趋势进行展望。

    Abstract:

    Cluster analysis is an important technique for data mining. In the 5G era, massive data has high dimensions and large data sets. The K-means algorithm is susceptible to outliers, and the k value and the selection of initial clustering centers affect the stability and accuracy of the clustering result. It even causes the clustering to fall into the local optimum, so the improvement of the K-means algorithm has attracted the attention of many researchers. This article mainly summarizes the current research status of K-means clustering. Firstly, it introduces the principle of K-means algorithm. Secondly, according to the selection of the initial clustering center point, the determination of the K value, and the outliers, the existing improved algorithms are classified and summarized based on density and distance, and the advantages and disadvantages of each improved algorithm are analyzed. Finally, the K-means algorithm is analyzed and prospects for possible future research directions and trends are discussed.

    参考文献
    相似文献
    引证文献
引用本文

王森,刘琛,邢帅杰. K-means聚类算法研究综述[J].华东交通大学学报,2022,39(5):120-126.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2022-10-28
  • 出版日期: