基于GDEM的集群远近关系识别及珍珠链可视化分析系统
项目介绍
本项目实现了一套基于GDEM(全局密度估计模型)的集群分析系统,能够对多维数据集进行集群检测和密度分析,量化集群间的空间关系,并通过创新的珍珠链可视化技术直观展示集群远近关系。系统提供交互式界面,支持用户灵活调整参数,探索不同聚类层次下的数据内在结构。
功能特性
- 集群检测与密度分析:采用GDEM算法自动识别数据中的密集区域和集群结构
- 关系量化分析:计算集群间的空间距离矩阵和密度关联强度指标
- 珍珠链可视化:通过珍珠大小表示集群密度,链长表示集群距离的动态可视化
- 交互式探索:支持参数实时调整,包括密度阈值、邻域半径、珍珠大小等
- 多维度输出:提供集群标签、关系报告、统计指标等全面分析结果
使用方法
- 数据准备:准备N×M维数值矩阵文件(CSV格式),首行为特征名
- 参数设置:配置GDEM参数(密度阈值、邻域半径等)和可视化参数
- 执行分析:运行系统进行集群识别和关系分析
- 结果查看:查看集群分配结果、关系分析报告和珍珠链可视化图
- 交互调整:通过界面调整参数重新分析,探索不同聚类粒度
系统要求
- MATLAB R2018b或更高版本
- 统计学和机器学习工具箱
- 至少4GB内存(推荐8GB以上)
- 支持交互式图形显示
文件说明
主程序文件整合了系统的核心处理流程,包括数据加载与预处理、GDEM聚类算法执行、集群间距离与关联强度计算、珍珠链可视化图形生成以及交互式参数调整界面的管理。该文件作为系统入口,协调各功能模块协同工作,确保从数据输入到结果输出的完整分析链路。