本项目基于 Intel Xeon 和 Xeon Phi 架构实现了深度神经网络的训练和精度检验。项目实现了并行的堆叠自动编码器和受限玻尔兹曼机 (RBM) 训练算法,并结合 Softmax 分类器神经网络进行精度评估。

算法实现:

  • 采用斯坦福大学深度学习教程提供的 Matlab 框架实现堆叠自动编码器。
  • 使用 Steepest Descent 算法计算梯度。

平台支持:

  • 支持 Intel Xeon 多核平台和 Intel Xeon Phi 多核平台。
  • Xeon Phi 平台需使用 -mmic 编译选项编译程序。
  • 可通过修改源代码和 consts.h 文件中的 OpenMP 参数优化 Xeon Phi 平台性能。

精度检验:

  • 程序加载训练数据集和测试数据集,并使用堆叠自动编码器算法训练神经网络。
  • 在测试数据集上评估训练好的网络并计算分类精度。

代码库:

Intel Xeon 和 Intel Xeon Phi 平台共享相同的代码库。