本项目基于 Intel Xeon 和 Xeon Phi 架构实现了深度神经网络的训练和精度检验。项目实现了并行的堆叠自动编码器和受限玻尔兹曼机 (RBM) 训练算法,并结合 Softmax 分类器神经网络进行精度评估。
算法实现:
- 采用斯坦福大学深度学习教程提供的 Matlab 框架实现堆叠自动编码器。
- 使用 Steepest Descent 算法计算梯度。
平台支持:
- 支持 Intel Xeon 多核平台和 Intel Xeon Phi 多核平台。
- Xeon Phi 平台需使用
-mmic
编译选项编译程序。 - 可通过修改源代码和
consts.h
文件中的 OpenMP 参数优化 Xeon Phi 平台性能。
精度检验:
- 程序加载训练数据集和测试数据集,并使用堆叠自动编码器算法训练神经网络。
- 在测试数据集上评估训练好的网络并计算分类精度。
代码库:
Intel Xeon 和 Intel Xeon Phi 平台共享相同的代码库。