这是一个基于PyTorch的MATLAB频谱分析代码,用于将给定音轨分离为人声和器乐茎。基于[1]的研究,他们在MATLAB中进行了自己的实现。运行代码以获取数据集,并从中提取用于模型训练的数据。他们通过电子邮件快速响应下载请求。需要注意的是,数据集压缩后达到41GB。更新文件medleydb_deepkaraoke.json的路径以解压缩数据。使用MedleyDB示例时,请从JSON文件中删除所有条目,仅保留示例中的条目。运行python spectrum_helper/init.py生成数据集,并使用python deep_karaoke.py train命令训练网络(使用--help查看选项)。参考[1]:Simpson AJR, Roma G., Plumbley MD (2015) Deep Karaoke: Extracting vocals from music mixtures using convolutional deep neural networks. In: Vincent E., Yeredor A., Koldovský Z., Tichavský P. (eds) Latent Variable Analysis and Signal Separation.