高维数据挖掘中特征选择的创新方法

算法与数据结构 15

1.13MB 2024-07-15

#数据挖掘 # 特征选择 # 高维数据 # 机器学习 # 稳健方法

针对高维数据的特性，即变量数远多于样本数，并且数据呈现异质性，基于众数回归分析和变量选择降维技术，提出了一种创新的特征选择方法。该方法利用局部二次逼近算法(LQA)和最大期望(EM)算法，提供了估计算法和最优调节参数的选取策略。通过模拟数据实验分析显示，该方法在非正态误差分布情况下，比传统的基于最小二乘和中位数的正则化估计方法具有更高的预测能力和稳健性。