MATLAB和Tensorflow集成在说话者验证系统中的应用

更新至2020年4月14日的VAD函数MATLAB代码。我注意到VoxSRC 2020已经启动。这个存储库可以作为挑战的基准。使用ResNet-18 + softmax在大约5900个说话者训练集上测试，Vox1测试集上获得1.8%的EER，这是一个不错的结果。尝试使用AMSoftmax损失，探索更深层次的网络，引入新的融合方法（如自注意力），并实现高级结构（如挤压和激励）。希望能取得更好的结果。享受训练的乐趣:-)更新至2019年11月19日，添加了多GPU训练配置文件选项。更多详细信息，请参考示例，例如egs/voxceleb/v3/run.sh。增加了一个标准的VoxCeleb示例，使用官方培训列表，包括VoxCeleb2开发集。添加了一个简单的ResNet + softmax示例，该示例在VoxCeleb1测试集中达到1.8%的EER。由于我们使用数据并行处理，因此每步的数据和梯度都会分布在多个GPU之间。