LINUX.ORG.RU

Распознавание речи

 


1

1

Привет. Появилась у меня одна фантазия, для этого нужно «оттекстовать» речь. Полез в сеть, есть готовые либы. Кто-нибудь юзал? Можно ли качественно! распознавать отечественную и буржуйскую речь? Поделитесь впечатлениями, можно ли получать на выходе не более процентов 5 ошибок распознавания? Ну и получать «стена» вместо «стина».

★★

Последнее исправление: pavlick (всего исправлений: 1)

проект уж не протух, а высох
мне кажется синтез текста из речи еще в освоении денег, многие заинтересованы в нем, и тогда умеющие сабж зарабатывают

x905 ★★★★★
()

https://github.com/alphacep/vosk-api

Поделитесь впечатлениями, можно ли получать на выходе не более процентов 5 ошибок распознавания?

Нет, все опенсорсное работает плохо. Можешь через гугл оттекстовать.

KillTheCat ★★★★★
()

можно ли получать на выходе не более процентов 5 ошибок распознавания?

Нейросетки пока могут только без шума на 1 натренированной паре: диктор — распознавалка.

Текст, надиктованный в реальных условиях разными голосами и при наличии естественных шумов распознаётся, например, DeepSpeech 7.5%, а человеком 5.8% ©. Ещё глянь Kaldi ©.

quickquest ★★★★★
()

Ну и получать «стена» вместо «стина»

Распознавалки обычно по словорям работают. Так что ты скорее всего получишь на выходе вообще другое слово, а не орфографическую ошибку, если оно его некорректно распознает.

nebularia ★★★
()

В этой области все плохо, кроме проприетарщины от гугла и пары других гигантов всё очень далеко от хорошего распознавания и синтеза, но и там сомневаюсь, что 95%...

peregrine ★★★★★
()
Ответ на: комментарий от peregrine

В этой области все плохо

И слава Богу! Хоть здесь все хорошо.

Боюсь даже представить, насколько размножились бы всякие устройства с прослушкой и прочей ересью, влезающей в жизнь людей, если бы научились. А прослушка телефонных разговоров тогда стала бы просто тотальной. Ну, нафиг такое будущее!

dave ★★★★★
()
Ответ на: комментарий от dave

И слава Богу! Хоть здесь все хорошо.

Боюсь даже представить, насколько размножились бы всякие устройства с прослушкой и прочей ересью, влезающей в жизнь людей, если бы научились. А прослушка телефонных разговоров тогда стала бы просто тотальной. Ну, нафиг такое будущее!

… И Алиса засмеялась. И Сири засмеялась

psv1967 ★★★★★
()
Ответ на: комментарий от dave

А прослушка телефонных разговоров тогда стала бы просто тотальной.

«Не шмогла…» ©.

quickquest ★★★★★
()
Ответ на: комментарий от dave

Так её не меньше. Просто приходится делиться результатами прослушки с гуглом, яндексом или майкрософтом.

peregrine ★★★★★
()
12 мая 2020 г.
Ответ на: комментарий от welkam

Хочется голосового ассистента сделать, получится ли без опыта?

mtrbk
()
Ответ на: комментарий от quickquest

Текст, надиктованный в реальных условиях разными голосами и при наличии естественных шумов распознаётся, например, DeepSpeech 7.5%, а человеком 5.8% ©. Ещё глянь Kaldi ©

Слава богу, а я думал, что это я один периодически не понимаю слова.

byko3y ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.