LINUX.ORG.RU

Проекту voxforge.org нужна ваша помощь

 , julius, , shpinx, voxforge


0

3

Вы уже давно хотите помочь движению за свободный софт, но не знаете как? Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы можете помочь в создании русской языковой модели для систем распознавания речи "Julius" и "Sphinx".

Построением языковых моделей занимаются ребята с сайта voxforge.org, которые будут рады вашей помощи в создании языковой модели русского языка.

Итак, чтобы помочь им, вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней. Проекту нужно всего 140 часов речи для создания качественной языковой модели, однако пока общий объем не достигает и 10 часов.

Дело нужное, предлагаю добровольцам присоединиться ко мне.

>>> Подробности

★★★★★

Проверено: anonymous_incognito ()
Последнее исправление: anonymous_incognito (всего исправлений: 1)

Жаль, что другой свободный проект, OSS4, так и не сделал поддержку микрофона в моей звуковой карте.

vurdalak ★★★★★
()
Ответ на: комментарий от vurdalak

Хотя может и зайду с ноута завтра. Там работает.

vurdalak ★★★★★
()

Вы уже давно хотите помочь движению за свободный софт, но не знаете как?

Ага, ща посмотрим, кто хочет.
Вон в неподтверждённых висит о KTechlab'e - nobody cares, не говоря о том чтоб подтвердить, ostin!

adriano32 ★★★
()

Посмотрел пока. Во-первых, нужна ява, во-вторых, в списке регионов только российские.

vurdalak ★★★★★
()
Ответ на: комментарий от ostin

Да, из-за явы я с линукса этого делать не стал (-;

К счастью, у меня везде есть ява.

vurdalak ★★★★★
()
Ответ на: комментарий от ostin

Блин, я послушал, как ALSA записала мой голос и ужаснулся. Дарт Вейдер отдыхает :) Наверное, надо днём записывать)

adriano32 ★★★
()
Ответ на: комментарий от vurdalak

>во-вторых, в списке регионов только российские.
Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Ramen ★★★★
()
Ответ на: комментарий от Ramen

Так всё правильно, нечего языковую модель гхеканьем и шоканьем засорять.

Таки шо ви говогите?

vurdalak ★★★★★
()

Хрень!

В моей бубунте не работает.

java version «1.6.0_20»
OpenJDK Runtime Environment (IcedTea6 1.9.7) (6b20-1.9.7-0ubuntu1)
OpenJDK 64-Bit Server VM (build 19.0-b09, mixed mode)

Микрофон input level подпрыгивает на звук. Что надо, чтобы жаба записала?

valich ★★★
()
Ответ на: комментарий от valich

> Что надо, чтобы жаба записала?

Бубен доставать :) Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

tulskiy
()
Ответ на: комментарий от tulskiy

Трижды матом выругался!

Открываю в Firefox 4, разрешаю апплету запуститься.
Когда пытаюсь записывать наконец увидел белые буковки на белом фоне:
«Java security AccessControlException access denied (javax.sound sampled AudioPermission record)»

valich ★★★
()
Ответ на: комментарий от zyoung

> arecord -f dat| aplay и alsamixer в соседней консоли

уууу, заклинания третьего уровня пошли в ход. Забавно!
Всего-то надо звук на микрофон записать... Эх лялекс...

valich ★★★
()

И поправьте ссылку на Sphinx на http://cmusphinx.sourceforge.net/

Отличный софт, достаточно быстро разобрался в простых примерах. Правда, до более сложной грамматики и парсинга так и не добрался. Да и акцент мой ему не нравился, а американцев понимал на ура.

Русская модель уже доступна или только разрабатывается?

tulskiy
()

>Проекту нужно всего 140 часов речи для создания качественной языковой модели

140 часов речи - «нинужно» :)

Для создания качественной языковой модели разработчикам нужно:
1. Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы
и создать очередную программу их распознавания (было уже 100500 попыток).
2. Отладить модель на записях профессиональных дикторов радио.
3. Тестировать и доделывать модель на произвольном речевом потоке.

quickquest ★★★★★
()

О, обязательно прямо сейчас и помогу. Я как раз сейчас пьяный.

anonymous
()
Ответ на: комментарий от quickquest

> Изучить фонологию - раздел языкознания, изучающий звуковые единицы языка - фонемы и создать очередную программу их распознавания (было уже 100500 попыток).

Carnegie Mellon University, разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи, я думаю, они знают что делают.

tulskiy
()
Ответ на: комментарий от tulskiy

>Если в других прогах запись работает, можно попробовать что-то из этого: закрыть все что может производить/записывать звук, открывать лучше в файерфоксе, если в параметрах звука файерфокс или приложение джава не показывается, попробовать запустить браузер через padsp, то есть `padsp firefox`, так весь звук будет форсирован через пульс.

Современная, кроссплатформенная джава. Просто прекрасно.

anonymous
()
Ответ на: комментарий от tazhate

нее. реально. еще я оказывается забыл юзефлаг nsplugin. а вобще до этого мне жаба невхер не уперлась

anonymous
()
Ответ на: комментарий от anonymous

ну это просто гуглится элементарно.
а лично я жаву часто пользую.

tazhate ★★★★★
()
Ответ на: комментарий от tulskiy

>...разработчки Sphinx, уже 30+ лет занимаются разработками в области распознавания речи...

За 30+ лет не записали 140 часов???

я думаю, они знают что делают.

А я уверен, что даже не догадываются о сложностях распознавания фонем в сплошном потоке, ибо почти все известные системы распознавания речи, обученные на одном множестве фонем, не могут перестроится на другое: «Да и акцент мой ему не нравился, а американцев понимал на ура». Это не я, а ты сказал :)

quickquest ★★★★★
()

Ни грамма фантазии.
В свое время решал эту проблему при помощи аудио книг.
Их читают люди с хорошей дикцией.

Fastman
()
Ответ на: комментарий от Fastman

Ну так оно и понимать будет только людей с хорошей дикцией. Просят люди помощи, значит им надо зачем-то, почему бы не помочь?

ostin ★★★★★
() автор топика

> вам нужно зайти на страничку и прочитать в микрофон несколько предложений, приведенных на ней.

После чего уже ни один логопед не поможет этому проекту.

Lumi ★★★★★
()

[ultra_fat]Смотрю тут проблемы с явой и звуком? А флеш это без бубна умеет ;)[/ultra_fat]

win7
()

Вы не программист, не дизайнер и знанием иностранных языков не блещете? Вы не нужны.

sid350 ★★★★★
()
Ответ на: комментарий от bender

>нет, это современная звуковая подсистема линукс

С флешом работает, а с супер-ынтерпрайзной джавой - нет?

anonymous
()

Хм...Текст читать вместе с ошибками?

John_Wehin
()
Ответ на: комментарий от alix

>А это разве не оно?

Нет. Это обучающие множества. Произвольный речевой поток - это, например, запись радиоспектакля со многими голосами, тембрами, акцентами, ... или запись полилога - «базара» на базаре :)

На сегодня, мне не известны модели распознавания фонем, инвариантные к временнЫм и спектральным особенностям речи.

quickquest ★★★★★
()

Меня глючит, или оно мне предлагает зачитать предложения из «Аэлиты» Алексея Толстого?

cPunk ★★
()

Оно подходит для проверки правильности произношения как это сделано в некоторых программах для изучения языков?

Leron ★★
()

О, поможем. Я люблю Java несмотря на то, что иногда она много памяти отжирает. Благо научился указывать приемлемые параметры потребления памяти, да и JRE 1.7 хоть и не стабильна, но резвее чем 1.6. За что Оракулу большое спасибо. Думаю, для Java-комьюнити покупка Sun Oracle'ом пользу принесёт.

lucentcode ★★★★★
()

Кошмар. Долбаный апплет не работает, можно бы записать через аудацити и кинуть файл на их файлообменник, но инструкцию по этому делу нужно долго и упорно переводить. Они не могли вывесить тексты для чтения и требования к формату аудиофайлов? Да не сложно записать и отправить, но трахаться с их жабами и инструкциями нет никакого желания.

Napilnik ★★★★★
()
Ответ на: комментарий от buddhist

>Помог бы, да нет микрофона

Ага, аналогично.

onix_N ★★
()

Поучаствовал, анонимно. Теперь думаю, кого ещё бы подключить к делу. Ничего, завтра будет день, посмотрю в список друзей в соцсетях...

lucentcode ★★★★★
()

Заметил, что их апплет выводит кривую похожую на те, что используют в интерактивных системах обучения иностранным языкам. Почему не напишут открытое Java-приложение для этого дела? На подобие Rosetta Stone или Tell me More?

lucentcode ★★★★★
()
Ответ на: комментарий от Ramen

хотелось бы мою хохляцкую дикцию сравнить с вашим россиянським прононсом. интересно, у кого бы гхеканья и шоканья было бы больше

Ingwar ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.