项目:增强随机搜索能力的极端学习机 (EI-ELM) 改进算法
1. 项目简介
本项目实现了一种基于极端学习机(ELM)的改进算法,称为 EI-ELM(Enhanced Random Search ELM)。针对传统 ELM 算法因随机初始化输入权重和偏置导致的网络性能不稳定及泛化能力差异大的问题,本项目在代码中引入了增强型的随机搜索策略。该策略通过在训练阶段进行多轮次的参数空间搜索与筛选,保留在训练集上表现最优的输入层参数,从而显著提升了模型的稳健性和预测精度。
当前代码实现了一个完整的非线性回归预测演示,包含了从数据生成、预处理、模型寻优训练到性能评估及可视化的全流程。
2. 功能特性
- 增强型参数寻优:通过多次迭代随机生成输入权重和偏置,自动筛选出使训练误差(RMSE)最小的参数组合,解决了 ELM "看运气" 的初始化问题。
- 非线性回归能力:内置非线性函数仿真数据生成器,验证模型拟合复杂曲线的能力。
- 完整的数据处理流程:包含数据分割(训练集/测试集)及基于 Min-Max 的数据归一化与反归一化处理逻辑。
- 多维性能评估:提供 MSE(均方误差)、RMSE(均方根误差)、MAE(平均绝对误差)和 R2(决定系数)等多种指标。
- 丰富的可视化输出:自动生成收敛曲线、拟合对比图、误差分布图及回归分析图。
3. 系统要求
- MATLAB R2016a 或更高版本
- 不需要额外的工具箱(代码内部实现了核心的数学运算,如伪逆求解和归一化,未依赖 Neural Network Toolbox)。
4. 算法实现逻辑与流程详解
主程序基于 MATLAB 脚本编写,其核心执行逻辑如下:
4.1 数据准备与预处理
程序首先清空工作区,并固定随机种子(rng 42)以确保结果的可复现性。
- 数据生成:构建了一个包含正弦和余弦分量的非线性函数 $y = sin(x) + cos(2x)$,并叠加了高斯白噪声。
- 数据集划分:将 500 个样本随机打乱,按 7:3 的比例划分为训练集和测试集。
- 数据归一化:实现了自定义的映射函数,将输入特征 $X$ 线性映射到 $[-1, 1]$ 区间。特别注意这里在处理测试集时,严格使用了训练集的统计参数(最大值/最小值)进行转换,避免了数据泄露。
4.2 模型超参数配置
设置了 ELM 网络的关键参数:
- 隐含层节点数:50 个
- 激活函数:Sigmoid
- 搜索迭代次数:200 次(这是 EI-ELM 核心优化的轮数)
4.3 EI-ELM 训练过程 (核心算法)
这是代码中最关键的部分,区别于传统 ELM 的一次性训练,该部分采用了一个循环结构进行优胜劣汰:
- 初始化记录器:设置当前最佳误差为无穷大。
- 迭代搜索:在 200 次循环中,每次执行以下步骤:
*
随机生成参数:在 $[-1, 1]$ 范围内随机生成一组输入权重 $W$ 和偏置 $Bias$。
*
计算隐含层输出:根据当前的 $W$ 和 $Bias$ 以及选定的激活函数(Sigmoid),计算隐含层输出矩阵 $H$。
*
求解输出权重:使用 Moore-Penrose 广义逆(
pinv 函数)求解输出层权重 $beta$。公式为 $beta = H^{dagger} cdot Y$。
*
性能评估:计算当前模型在训练集上的 RMSE。
*
更新最优模型:如果当前的 RMSE 小于历史最佳 RMSE,则更新全局最优参数($W_{best}, B_{best}, beta_{best}$)。
- 收敛记录:记录每次迭代后的当前最佳误差,用于后续绘制收敛曲线。
4.4 预测与测试
利用训练阶段筛选出的最佳模型参数($W_{best}, B_{best}, beta_{best}$)对训练集和测试集进行前向传播预测。测试集数据经过了与训练集相同的预处理步骤。
4.5 性能评价
计算并打印以下指标,量化模型在训练集和测试集上的表现:
- MSE:反映预测值与真实值偏差的平方均值。
- R2 (决定系数):评估模型对数据变异性的解释程度,越接近 1 越好。
- MAE:反映预测误差的平均绝对值。
4.6 结果可视化
程序最后会生成三个独立的图形窗口:
- 输入参数搜索收敛曲线:展示随着随机搜索迭代次数的增加,训练集 RMSE 如何逐步降低并趋于稳定。
- 预测结果对比图:包含两部分,一是测试集样本排序后的真实值与预测值拟合曲线,二是预测误差的针状图。
- 回归分析图:展示测试集真实值 vs 预测值的散点分布,并绘制 $y=x$ 参考线,直观反映相关性。
5. 关键函数实现分析
代码中定义了三个辅助子函数来支撑主逻辑:
*
功能:通用的隐含层计算引擎。
*
细节:能够处理输入数据与权重矩阵的乘法运算,并利用
repmat 扩展偏置向量以匹配样本数量。内部使用
switch-case 结构支持多种激活函数(Sigmoid, Sine, ReLU, Tanh, Hardlim),增强了代码的扩展性。
*
功能:标准化评估指标计算器。
*
细节:接收真实值和预测值向量,通过向量化运算快速返回 MSE、R2 和 MAE。计算 R2 时在分母添加了极小量
eps 以防止除零错误。
*
功能:模拟 MATLAB 工具箱
mapminmax 的归一化函数。
*
细节:具有两种工作模式。当只输入原始数据时,它会计算数据的极值并建立映射规则(训练阶段);当同时输入数据和映射结构体
ps 时,它会应用已有的规则(测试阶段)。这种设计严谨地遵循了机器学习的数据处理规范。
6. 使用方法
- 打开 MATLAB 软件。
- 将包含代码的脚本文件设置为当前工作路径。
- 直接运行
main 函数。 - 观察命令行输出的迭代日志和最终的性能指标。
- 查看生成的三个分析图表以评估模型效果。