针对高维数据的特性,即变量数远多于样本数,并且数据呈现异质性,基于众数回归分析和变量选择降维技术,提出了一种创新的特征选择方法。该方法利用局部二次逼近算法(LQA)和最大期望(EM)算法,提供了估计算法和最优调节参数的选取策略。通过模拟数据实验分析显示,该方法在非正态误差分布情况下,比传统的基于最小二乘和中位数的正则化估计方法具有更高的预测能力和稳健性。
高维数据挖掘中特征选择的创新方法
相关推荐
高维数据挖掘中特征选择的稳健方法
针对112Gb/s PM-(D)QPSK系统,特别是具有2.5GHz最大频偏的典型激光器,存在 |△f-f_e|=π/2 或 |f-f_e|=Rs/4 的情况。此时,若能判断频偏估值是否错误,则可利用此规律直接获得正确频偏估值,并将其作为G-PADE的初始设置值。
判断频偏估值正确与否可通过BER轻松实现,因为正确和错误的估值对应着截然不同的BER:一个接近0.5,另一个略大于0。因此,无论初始真实频偏为何值,G-PADE的初始化问题都能得到解决。方法如下:
G-PADE开始工作前,利用四次方法对一段符号进行频偏估计,同时监测该段符号的BER。
通过BER判断估值是否收敛正确。
若正确,则将该段符号的频偏估值作为G-PADE的初始设置频偏值;若错误,则根据 |f-f_e|=Rs/4 计算出正确频偏值,并将其作为G-PADE的初始设置频偏值。
仿真结果表明,数据块长度为1000时,四次方频偏估计算法在不同频偏下的最大可能初始化误差基本相同,平均为0.135GHz。负频偏情况下的结果也基本一致。这表明,当四次方频偏估计算法的数据块长度确定时,无论频偏多大,其用于G-PADE初始化的最大可能误差基本保持不变。数据块长度为1000时,最大误差小于0.2GHz,满足要求。因此,前述方法可行地用于G-PADE的初始化。
数据挖掘
6
2024-05-19
高维数据挖掘中特征选择的稳健方法总结
表4.7 总结了在高维数据挖掘中特征选择方法vV算法中问变量的取值范围。这些变量的理论和实测范围包括定点设计属性输入符号的实部和虚部,以及幅度。具体包括(-2, +2)和(-16, +16)的幅度。此外,还涵盖了一组符号四次方后的求和结果,以及该结果的幅度(-128, +128)。各组符号的相位调整在(+1, +4)之间,确保输出符号的相位偏估计结果精确有效。
数据挖掘
0
2024-09-14
数据挖掘中的创新方法支持向量机探索
国内一位教师撰写的数据挖掘教材,着眼于优化方法,深入探讨了支持向量机的应用。
数据挖掘
3
2024-07-13
数据挖掘中的创新方法支持向量机探索
支持向量机作为数据挖掘领域中的新兴方法,正逐步成为研究重点。它以其在处理复杂数据集方面的卓越表现,吸引了广泛的关注和应用。
数据挖掘
2
2024-07-17
创新方法上海证交所数据挖掘培训
利用神经网络、逻辑回归和决策图表结合的新方法,开发了一种创新的破产/风险模型。新的变量选择过程使得该模型显著超越了传统商业模型。
数据挖掘
2
2024-07-14
数据库设计的创新方法
讨论了数据库设计的相关概念和技巧,帮助读者更好地理解和应用数据库技术。
MySQL
0
2024-08-02
SqlServer列转行的创新方法
SqlServer列转行的新探索!
SQLServer
3
2024-07-14
数据挖掘中的新方法-支持向量机
中国农业大学邓乃扬教授编著的专著,全面讲解支持向量机的原理、方法和应用。
数据挖掘
3
2024-05-01
基于预判决的频偏估计算法原理-高维数据挖掘中特征选择的稳健方法
基于预判决的频偏估计算法(PADE算法)是一种应用于相干接收机中的前馈式全数字频偏估计方法,主要通过模拟预判决来估计当前符号的频偏,结合环路滤波器抑制噪声影响,有效消除载波频偏对相位调制信号的影响。与传统四次方频偏估计算法不同,PADE算法依赖于前一个输入符号的频偏估计结果,以优化当前符号的频偏估计,最终通过减去估计值来修正频偏引起的相位分量。
数据挖掘
0
2024-08-08