本站所有资源均为高质量资源,各种姿势下载。
2014年6月发表于Science的《Clustering by fast search and find of density peaks》提出了一种突破性的无监督聚类方法。该算法的核心思想颠覆了传统基于距离迭代的思路,转而利用数据点的局部密度和相对距离来识别聚类中心。
核心逻辑分为三阶段: 密度计算:通过核密度估计或截断距离法量化每个数据点邻域内的密度,高密度区域暗示潜在聚类中心。 相对距离度量:对每个点计算其到更高密度点的最小距离,密度最高点的该距离通常取最大值。 决策图筛选:将密度和相对距离绘制为二维决策图,右上角的离群点即为聚类中心,非中心点被分配到最近的高密度点所属簇。
该算法优势在于: 自动确定簇数量,无需预设K值 可发现任意形状的簇 对噪声点具有鲁棒性
其开源实现已成为生物信息学、天体物理学等领域的标准工具,尤其适合处理具有复杂密度分布的高维数据。