针对工业大数据中高维小样本带来的挑战,提出一种多层增量特征提取方法,有效降低数据维度,并最大程度保留样本的变异和判别信息。

方法步骤:

  1. 数据预处理: 利用滑动窗口增量更新数据流,检测并过滤离群点,通过增量主成分分析(PCA)进行初步特征提取,并利用Fisher准则函数评估各主成分的分类信息含量。
  2. 主成分筛选: 采用熵值法确定各主成分的贡献率和识别能力权重,筛选出对分类贡献最大的主成分,构建新的特征空间。
  3. 二次特征提取: 将当前窗口的高维数据通过增量线性判别分析(LDA)投影到新的特征空间,完成二次特征提取并确定样本类别。

实验结果表明,该方法能够有效提取实时数据特征,并保持良好的判别能力。