История изменений
Исправление misteralter, (текущая версия) :
Вообще в теории можно сделать голос и для русского языка и использовать в xVA-Synth , но обучать модель придётся самому. Автор это делать не будет, у него другие приоритеты. Примерно будет выглядеть так: Нужно сделать датасет для каждого звукового файла с таймингами текста используя Tacotron2 и потом скормить это FastPitch и уже оттуда в xVASynth
Исходная версия misteralter, :
Вообще в теории можно сделать голос и для русского языка и использовать в xVA-Synth , но обучать модель придётся самому. Автор это делать не будет, у него другие приоритеты. Примерно будет выглядеть так: