LINUX.ORG.RU
ФорумTalks

Мой гугло-фу просто фу! Автосубтитры.

 , ,


0

1

Я тут залез в youtube (да-да, это мерзко и пошло, но такова жизнь) и наткнулся на такую офигительную хрень: это чудо автоматически распознаёт речь и пишет субтитры.
Для английского языка очень даже прилично получается.
Кто знает как это работает? Оно в реалтайме фурычит или медленно пережёвывает, а потом просто даёт возможность посмотреть результат? Похоже на реалтайм, поскольку слова добавляются по одному синхронно речи, а не целыми предложениями.
А если реалтайм, то это какая-то внутренняя закрытая гугло-приблуда или есть какая-то либа?
Хочу видеоплеер, который будет на лету писать субтитры.

Оно в реалтайме фурычит или медленно пережёвывает, а потом просто даёт возможность посмотреть результат? Похоже на реалтайм, поскольку слова добавляются по одному синхронно речи, а не целыми предложениями.

Сам подумай - на кой в реалтайме проводить достаточно тяжёлые вычисления (скормить аудиопоток ИНС - это тебе не select subtitles from video where id=%1), если можно провести их после загрузки видео и сохранить результат?

з.ы. и да, у них есть публичное api для распознания речи.

alex4321
()
Ответ на: комментарий от MimisGotAPlan

Не, никто не прикрутил: бесплатно только 60 минут в месяц. В таком режиме нахрен не нужно.

MimisGotAPlan
() автор топика

В реалтайме был бы оверхед дикий. Я бы эту фичу прикрутил на этапе заливки видоса, но если учитывать гугловский хайлоад, то скорее всего из-за всевозможных оптимизаций у них это происходит не сразу.

Nietzsche
()

Похоже на реалтайм, поскольку слова добавляются по одному синхронно речи, а не целыми предложениями.

Это вроде как часть формата vtt. Хотя я не разобрался пока.

Хочу видеоплеер, который будет на лету писать субтитры.

Заливаешь на ютуб, скачиваешь youtube-dl только сгенерированные субтитры. profit.

atrus ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.