专用于人声的去混响模型,适用于 https://github.com/ZFTurbo/Music-Source-Separation-Training

微调自kim的人声乐器分离模型,所以保留了一些分离人声与乐器的能力

训练数据的干声为单声道单人演唱/说话,所以模型会尽可能使分离后的干声为单声道,导致在分离一些人声为立体声或者经过叠轨等处理的音频时可能会出问题,dereverb_mel_band_roformer_less_aggressive_anvuew_sdr_18.8050.ckpt是使用为这些情况的样本挑出来的dereverb_mel_band_roformer_anvuew_sdr_19.1729.ckpt训练中期的权重

dereverb_mel_band_roformer_anvuew_sdr_19.1729.ckptdereverb_mel_band_roformer_less_aggressive_anvuew_sdr_18.8050.ckpt两个权重由于训练代码bug,在训练时混响与人声实际并未对齐,所以这两个模型表现出一定程度的去除人声与乐器分离后的残留(通常是弦乐)以及部分和声(非中央声道)的能力

dereverb_mel_band_roformer_mono_anvuew_sdr_20.4029.ckpt则因修复了对齐bug,去混响的能力更强了,但是去人声乐器分离残留以及和声的能力下降了

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Space using anvuew/dereverb_mel_band_roformer 1