本站所有资源均为高质量资源,各种姿势下载。
NJW谱聚类是一种基于图论的无监督学习方法,通过数据点间的相似度矩阵构建图结构,再对图拉普拉斯矩阵进行特征分解实现降维聚类。以下是该算法的核心实现逻辑:
相似度矩阵构建 首先计算数据点之间的欧氏距离,通过高斯核函数转换为相似度矩阵。带宽参数σ控制局部邻域范围,需根据数据分布调整——σ过小会导致矩阵过于稀疏,过大则失去局部特性。
图拉普拉斯矩阵计算 对相似度矩阵进行对称归一化处理,得到拉普拉斯矩阵。具体步骤包括: 计算度矩阵(对角线为每个节点的连接权重之和) 归一化拉普拉斯矩阵 = 度矩阵^(-1/2) × 相似度矩阵 × 度矩阵^(-1/2)
特征向量提取 对归一化拉普拉斯矩阵进行特征分解,选取前k个最小非零特征值对应的特征向量(k为目标聚类数)。这些特征向量构成新的低维空间,其正交性比原始数据更利于聚类。
K-means聚类 将特征向量按行组成新矩阵,对其行向量进行K-means聚类。最终聚类结果即为原始数据的谱聚类划分。
参数调优建议 σ通常通过网格搜索结合轮廓系数确定 聚类数k可通过特征值拐点法(elbow method)选择 若结果不稳定,可尝试对特征向量进行行归一化
该算法适合处理非凸分布数据,但对大规模矩阵的特征分解计算成本较高,可考虑使用稀疏矩阵或Nyström近似优化。