MATLAB频谱分析代码深度卡拉OK制作工具

这是一个基于PyTorch的MATLAB频谱分析代码，用于将给定音轨分离为人声和器乐茎。基于[1]的研究，他们在MATLAB中进行了自己的实现。运行代码以获取数据集，并从中提取用于模型训练的数据。他们通过电子邮件快速响应下载请求。需要注意的是，数据集压缩后达到41GB。更新文件medleydb_deepkaraoke.json的路径以解压缩数据。使用MedleyDB示例时，请从JSON文件中删除所有条目，仅保留示例中的条目。运行python spectrum_helper/init.py生成数据集，并使用python deep_karaoke.py train命令训练网络（使用--help查看选项）。参考[1]：Simpson AJR, Roma G., Plumbley MD (2015) Deep Karaoke: Extracting vocals from music mixtures using convolutional deep neural networks. In: Vincent E., Yeredor A., Koldovský Z., Tichavský P. (eds) Latent Variable Analysis and Signal Separation.