Вариантов не подскажу, а этот у меня модель подгружать не хочет. Чего ему не хватает? Load model from piper-voices/ru/ru_RU/irina/medium/ru_RU-irina-medium.onnx failed:Protobuf parsing failed.
Кстати, если предполагается некоторый бюджет, то встречались платные сервисы с вполне приемлемым произношением. На каких сайтах - уже не помню. Для моей задачи это было дорого.
Звучит субъективно лучше silero. У последнего беда с мужскими голосами. Пощупать bark, как-то не довелось — его не прикручивали к Демагогу, что по своему тоже показатель.
Это же не для генерации аудиокниг? Из-за «любительских» голосов они как-то не очень для этой цели. Балаболка+Yuri Harpo звучит для меня лучше, чем silero и piper, не в последнюю очередь из-за возможности настроек пауз и профессионального диктора в основе, несмотря на менее живое звучание. Хотя в случае Piper надрессировать «правильную» модель проблем вроде нет.
ps. Не, в примерах барк не особо звучит, а у piper плавает скорость и высота речи относительно silero, но возможно это из-за запуска под wine.
А ухудшенные, но более быстрые модели silero в коллабе. На mytts говорили, что более качественное они подспрятали. Но проще и быстрее скачать сборку https://aloys.narod.ru/sof/1/demagog.htm (где-то внизу) — работает в wine без видимых проблем (для одной задачи — другое не пробовалось). Если имелось ввиду что-то типа докера, то не знаю.
piper же нативно запускается, зачем тут wine ?
Мне нужна программа для создания аудиокниг. Экспериментальная сборка Демагога с piper — это самый простой вариант.
нет, нужно 2-3 предложения
Тогда и особого смысла связываться с silero нет. Они с piper примерно одинаково лажают с ударениями, а у silero новых публичных голосов скорей, из-за огороженности, всего и не появится.