LINUX.ORG.RU

Есть ли готовое решение для нарезки аудио-словаря по базе?

 , ,


1

3

Имеется база большого количества аудиофайлов. Нужно составить условный аудиословарь: чтобы по списку слов был осуществлен поиск соответствующих фрагментов и их помещение в отдельные файлы с соответствующими названиями. Конечная цель - возможность сборки аудиосообщение из понадерганых откуда попало слов, что-то вроде письма газетными буквами, только аудио версия. Ясное дело, ручками это все резать свихнуться можно.

что-то вроде письма газетными буквами

Тоже любишь «Собаку Баскервилей»? :)

hobbit ★★★★★
()
Ответ на: комментарий от hobbit

Почти) Надо для научно-фантастической рп. Понарезаннный голос звучит намного круче чем просто синтезированный.

Nevermind
() автор топика

В стиле юникс-вея можно

1. сгенерить сабы к файлам

2. пропарсить сабы на предмет нужных слов

3. вырезать куски

Если для 2,3 проги на слуху, то самая проблема будет в пункте 1.

mydibyje ★★★
()
Последнее исправление: mydibyje (всего исправлений: 1)

А база большого количества аудиофайлов случаем не из (законно купленных) аудиокниг состоит?

mydibyje ★★★
()
Ответ на: комментарий от mydibyje

Из фильмов. Которые для удобства не проблема перегнать под аудио. Но в целом не принципиально из чего нарезать.

Nevermind
() автор топика
Ответ на: комментарий от mydibyje

Думал об этом, но как это сделать то? В смысле, какие конкретно программы? С субтитрами… ну да, нужно искать какаую-нибудь лабуйню с распознаванием речи (или залить на ютуб и сгенерить автоматические сабы там до того как прилетит страйк за пиратство).

Nevermind
() автор топика
Ответ на: комментарий от Nevermind

Принципиально, ведь к фильмам проще достать готовые сабы, тогда как аудиокниги не синхронизированы с текстом и их уж точно придется распознавать ИИшечкой.

mydibyje ★★★
()
Последнее исправление: mydibyje (всего исправлений: 1)
Ответ на: комментарий от Nevermind

Режет и сшивает ffmpeg, искать слова в текстовых файлах сабов можно даже скриптовым языком из командной строки, но нужно будет написать скриптик. А актуальные бесплатные speech/audio-to-text решения для русского языка надо поискать...

mydibyje ★★★
()
Последнее исправление: mydibyje (всего исправлений: 4)
Ответ на: комментарий от mydibyje

И все таки есть проблема. Сабы со звуком синхронизированы максимум на уровне предложений. А на уровне слов, которые и нужны - нет. Я не прав?

Nevermind
() автор топика
Ответ на: комментарий от Nevermind

Вы правы, но по-вашему слова должны собираться во фразы, а ведь фраза где разные слова звучат разными голосами может даже попеременно мужскими-женскими нарушит атмосферу рп, тут лучше целые фразы выдергивать чему фразо-сабы из фильмов и помогут.

mydibyje ★★★
()
Ответ на: комментарий от mydibyje

Не-не-не. В этом и смысл! РП научнофантастическая. В реальности любой уважающий себя искусственный интелект прикрутил бы себе спич синтез, но звучит это не так эпично как относительно коряво склеенные слова. Эстетика всратости и все такое

Nevermind
() автор топика
Ответ на: комментарий от umren

Эээ. Ну я не настолько красноглазый, чтобы понимать как это сделать

Nevermind
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.