本站所有资源均为高质量资源,各种姿势下载。
在生物信息学领域,基因选择是提高样本分类性能的关键预处理步骤。传统方法虽然能筛选出有效基因,但存在可解释性差、冗余度高等问题。本文提出的混合方法通过融合K-means聚类与二进制粒子群算法(BPSO),实现了更优的基因子集选择。
核心技术框架分为三阶段:首先采用PSO优化的K-means对基因进行预聚类,通过优化初始聚类中心提升基因分组的合理性;随后构建两个并行BPSO优化通道,分别整合基因类别灵敏度(GCS)和基因调控(GR)信息,这两种生物学特性能够有效反映基因与疾病类别的关联强度及基因间的调控关系;最后通过极限学习机(ELM)评估所选基因子集的分类性能。
该方法的创新点在于:1)利用PSO优化初始化过程,克服传统K-means对初始值敏感的问题;2)双BPSO结构同时捕捉基因的判别能力和调控网络特征;3)通过ELM快速验证,形成闭环优化。实验证明,相比单一BPSO-GCS或传统过滤式方法,该混合策略选择的基因子集具有更低的冗余度和更高的分类准确率,尤其在小型基因表达谱数据上表现突出,为生物标记物发现提供了新思路。