LINUX.ORG.RU

Ищу голосовой помощник. Диктовалку. Или шото-типа этого.

 , ,


0

2

Нужна примочка для диктовки текста в офисные пакеты/консоль.

Вот под оффтопом пользовался например Laitis (https://www.youtube.com/watch?v=PjpnzkjTK3Y&t=1s)

Который, хоть и намертво заколочен на онлайн-службы, но блин, САМОЕ ГЛАВНОЕ, умеет stt-сить продиктованное в активное окно любого открытого приложения.

Я сколько не роюсь во всяких студенческих поделках-«помощниках» (типа Васисюалей или Иринов), но именно этого они делать и не умеют! (Зато «умеют» много всякой ненужной фигни https://github.com/Oknolaz/vasisualy/wiki/Возможности)

Мне будет достаточно, если сабж будет уметь по зажатому хоткею отлавливать голос с микрофона и пихать его в зафокусированное приложение, имитируя ввод с клавиатуры. Можно даже без спелчекинга, автозамены и смены расскадки.

Неужели нету такого?

★★

Последнее исправление: hargard (всего исправлений: 2)

tts

это обратный процесс.

помощники

ортогональны.

Для диктования нужна распознавалка + ввод. Распознавалки есть, причем довольно хорошие, вся проблема во вводе. Есть черезжопные решения на любой вкус - на базе хрома, KDE Connect и разпознавалка на андроиде

Нужен либо модуль IME, либо виртуальное устройство ввода.

Запили себе сто строчек или поменяй имитацию резиновой женьщины© на Операционную Систему, в которой искаропке вызываешь Super+H и диктуешь.

Меня, кстати, давно интересует противоположный вопрос: диктование мне не особо нужно, а голосовые команды - ещё как. Но хотелось бы полностью оффлайн (или self-hosted), по возможности на андроид-устройстве, и чтобы реагировало на wake word. Ни один из открытых помощников такое не умеет. А уж совсем восторг вызовет поддержка польского или русского.

token_polyak ★★★★★
()
Последнее исправление: token_polyak (всего исправлений: 5)
Ответ на: комментарий от token_polyak

это обратный процесс.

я тоже на этом завис, но потом почитал повнимательнее. ТС-у надо надиктовать своим голосом, а потом tts-ом проверить, что именно там распозналось.

aol ★★★★★
()
Ответ на: комментарий от aol

Я изначально так и понял, но потом почитал повнимательнее: «ttsить в окно» это явная оговорка (in dubio pro reo) или незнание акронима.

token_polyak ★★★★★
()
Последнее исправление: token_polyak (всего исправлений: 1)
Ответ на: комментарий от token_polyak

Так точно, очепятался, надобен speech-to-text.

Тискал я ряд черезжопных решений на питоне - не подходит. Мало того что они по числу зависимостей могут тягаться с плазмой, и зачастую им подавай строго определенную (естественно, древнюю) версию библиотек, так и основную требуемую фичу не умеют. :(

А с хромом и гаглосервисами лишний раз связываться желания нет.

hargard ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.