更新至2020年4月14日的VAD函数MATLAB代码。我注意到VoxSRC 2020已经启动。这个存储库可以作为挑战的基准。使用ResNet-18 + softmax在大约5900个说话者训练集上测试,Vox1测试集上获得1.8%的EER,这是一个不错的结果。尝试使用AMSoftmax损失,探索更深层次的网络,引入新的融合方法(如自注意力),并实现高级结构(如挤压和激励)。希望能取得更好的结果。享受训练的乐趣:-)更新至2019年11月19日,添加了多GPU训练配置文件选项。更多详细信息,请参考示例,例如egs/voxceleb/v3/run.sh。增加了一个标准的VoxCeleb示例,使用官方培训列表,包括VoxCeleb2开发集。添加了一个简单的ResNet + softmax示例,该示例在VoxCeleb1测试集中达到1.8%的EER。由于我们使用数据并行处理,因此每步的数据和梯度都会分布在多个GPU之间。