本项目旨在构建一个高度封装且易于使用的决策树分析工具,核心目标是简化从原始数据到决策模型的转化过程。该系统允许用户直接输入结构化数据(如Excel、Text、CSV或MATLAB工作区变量)以及对应的特征变量名称和目标变量标签。在内部处理机制上,程序集成了数据预处理模块,能够自动识别并处理缺失值,转换分类变量。核心算法基于MATLAB统计与机器学习工具箱中的fitctree(用于分类)和fitrtree(用于回归)函数,采用经典的CART算法构建二叉树。系统具备自动剪枝优化功能,通过计算交叉验证误差来确定最佳树深度,有效防止过拟合。在可视化方面,项目能够生成高分辨率的决策树视图,清晰展示每个节点的判断条件、样本数量和分类纯度,并支持输出特征重要性(Feature Importance)条形图,帮助用户直观理解哪些变量对决策结果影响最大。此外,工具还能自动生成混淆矩阵、ROC曲线及准确率报告,适用于金融风控、医疗诊断、客户分类等多种数据挖掘场景。