Есть ли готовое решение для нарезки аудио-словаря по базе?

1

3

Имеется база большого количества аудиофайлов. Нужно составить условный аудиословарь: чтобы по списку слов был осуществлен поиск соответствующих фрагментов и их помещение в отдельные файлы с соответствующими названиями. Конечная цель - возможность сборки аудиосообщение из понадерганых откуда попало слов, что-то вроде письма газетными буквами, только аудио версия. Ясное дело, ручками это все резать свихнуться можно.

Ссылка

←	Не работает хоткей для запуска gnome-calculator в KDE

CUPS пишет «Filter failed»

→

что-то вроде письма газетными буквами

Тоже любишь «Собаку Баскервилей»? :)

hobbit ★★★★★
(24.05.22 20:33:19 MSK)

Ответ на: комментарий от hobbit 24.05.22 20:33:19 MSK

Почти) Надо для научно-фантастической рп. Понарезаннный голос звучит намного круче чем просто синтезированный.

Nevermind
(24.05.22 20:36:35 MSK) автор топика

Ссылка

В стиле юникс-вея можно

1. сгенерить сабы к файлам

2. пропарсить сабы на предмет нужных слов

3. вырезать куски

Если для 2,3 проги на слуху, то самая проблема будет в пункте 1.

mydibyje ★★★
(24.05.22 22:11:05 MSK)
Последнее исправление: mydibyje 24.05.22 22:11:50 MSK (всего исправлений: 1)

А база большого количества аудиофайлов случаем не из (законно купленных) аудиокниг состоит?

mydibyje ★★★
(24.05.22 22:14:00 MSK)

Ответ на: комментарий от mydibyje 24.05.22 22:14:00 MSK

Из фильмов. Которые для удобства не проблема перегнать под аудио. Но в целом не принципиально из чего нарезать.

Nevermind
(24.05.22 22:39:53 MSK) автор топика

Ответ на: комментарий от mydibyje 24.05.22 22:11:05 MSK

Думал об этом, но как это сделать то? В смысле, какие конкретно программы? С субтитрами… ну да, нужно искать какаую-нибудь лабуйню с распознаванием речи (или залить на ютуб и сгенерить автоматические сабы там до того как прилетит страйк за пиратство).

Nevermind
(24.05.22 22:41:46 MSK) автор топика

Ответ на: комментарий от Nevermind 24.05.22 22:39:53 MSK

Принципиально, ведь к фильмам проще достать готовые сабы, тогда как аудиокниги не синхронизированы с текстом и их уж точно придется распознавать ИИшечкой.

mydibyje ★★★
(25.05.22 20:00:10 MSK)
Последнее исправление: mydibyje 25.05.22 20:00:42 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Nevermind 24.05.22 22:41:46 MSK

Режет и сшивает ffmpeg, искать слова в текстовых файлах сабов можно даже скриптовым языком из командной строки, но нужно будет написать скриптик. А актуальные бесплатные speech/audio-to-text решения для русского языка надо поискать...

mydibyje ★★★
(25.05.22 20:06:30 MSK)
Последнее исправление: mydibyje 25.05.22 20:07:33 MSK (всего исправлений: 4)

Ответ на: комментарий от mydibyje 25.05.22 20:06:30 MSK

И все таки есть проблема. Сабы со звуком синхронизированы максимум на уровне предложений. А на уровне слов, которые и нужны - нет. Я не прав?

Nevermind
(29.05.22 15:31:58 MSK) автор топика

Ответ на: комментарий от Nevermind 29.05.22 15:31:58 MSK

Вы правы, но по-вашему слова должны собираться во фразы, а ведь фраза где разные слова звучат разными голосами может даже попеременно мужскими-женскими нарушит атмосферу рп, тут лучше целые фразы выдергивать чему фразо-сабы из фильмов и помогут.

mydibyje ★★★
(29.05.22 17:07:36 MSK)

Ответ на: комментарий от mydibyje 29.05.22 17:07:36 MSK

Не-не-не. В этом и смысл! РП научнофантастическая. В реальности любой уважающий себя искусственный интелект прикрутил бы себе спич синтез, но звучит это не так эпично как относительно коряво склеенные слова. Эстетика всратости и все такое

Nevermind
(30.05.22 20:26:21 MSK) автор топика