2. Configuring the pretrained model
Feature Encoder (choose only one):
(1) Download the pre-trained ContentVec encoder and put it under pretrain/contentvec folder.
(2) Download the pre-trained HubertSoft encoder and put it under pretrain/hubert folder, and then modify the configuration file at the same time.
Vocoder or enhancer:
Download the pre-trained NSF-HiFiGAN vocoder and unzip it into pretrain/ folder.
Or use the https://github.com/openvpi/SingingVocoders project to fine-tune the vocoder for higher sound quality.
Pitch extractor:
Download the pre-trained RMVPE extractor and unzip it into pretrain/ folder.
「pretrain」に以下の構成になるように配置します。
モデルの準備
DDSP-SVCのモデルを準備します。
Google Colaboratroryで訓練する方法は以下になります。
2. Configuring the pretrained model
Feature Encoder (choose only one):
(1) Download the pre-trained ContentVec encoder and put it under pretrain/contentvec folder.
(2) Download the pre-trained HubertSoft encoder and put it under pretrain/hubert folder, and then modify the configuration file at the same time.
Vocoder or enhancer:
Download the pre-trained NSF-HiFiGAN vocoder and unzip it into pretrain/ folder.
Google ColaboratoryでDDSP-SVCのモデルを訓練しました。VRAMをそこまで使用しないため無料版ユーザでも利用可能だと思います。モデルの学習が終わればGPUなしのローカル環境でも音声変換を行うことができます。
また、関連するリポジトリやコードをメンテナンスしていただいている皆様に感謝いたします。