LINUX.ORG.RU

Распознание речи на нескольких языках сразу

 , ,


0

2

Пример: https://t.me/dfzwe4/65269 Чередуются реплики на нескольких языках.

Правильно ли я понимаю, что Whisper и Whisper.cpp должны уметь такое обрабатывать? Для роликов на русском Whisper.cpp мне иногда выдавал смесь русского и английского :) Но здесь всё опознал как английский. Модель large-v3-turbo-q8_0. Пробовать другие модели?

★★★★★
Ответ на: комментарий от CrX

А есть другие варианты

Может оказаться, что другие модели whisper в принципе не могут делать это лучше или хуже, и их перебирать бесполезно. Или могут сразу предложить принципиальро другую модель, заточенную под такие задачи. Поэтому спросил.

question4 ★★★★★
() автор топика

С чередованием языков не приходилось сталкиваться

Попробуй принудительно выбрать русский язык (–language ru). Вставки на своем основном языке (en) он распознает с большей вероятностью

Ну и есть вариант с брутфорсом - разбить файл на отдельные куски с одним языком, и распознавать отдельно. Как разбить - хз, может вручную

router ★★★★★
()