LINUX.ORG.RU
ФорумTalks

Нейросеть для караоке (прочитайте внимательно пост, про vocalremover я и так знаю)

 ,


0

1

Существует ли нейросеть, которая позволяет из аудиофайла песни и её текста получить видео как в караоке, чтобы буквы закрашивались, когда надо петь?


По караоке готовое не подскажу, но делал субтитры с помощью Whisper - очень недурно выходило. Может есть что-то готовое что из субтитров сделает караоке-видео, тогда можно в два приема решить)

frunobulax ★★★
()
Ответ на: комментарий от Wapieth

Да, если скачать модели, в которых нет .en.
Но на песнях я не пробовал.

dataman ★★★★★
()
Ответ на: комментарий от dataman

На моменте генерации видео из wts ошибка:

bash: /usr/bin/ffmpeg: Слишком длинный список аргументов

Текст на русском, что-то распозналось, судя по логам и самому файлу. Само имя файла на английском, без пробелов.

Wapieth
() автор топика
Последнее исправление: Wapieth (всего исправлений: 2)
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)