LINUX.ORG.RU

Синтезатор русской речи для Ubuntu, нужна помощь


0

0

Jonathan Duddington, разработчик новой системы для синтезирования речи написал мне письмо. Публикую его здесь, тк надеюсь на помощь сообщества. Если кто-нибудь заинтересовался и может помочь разработчику с реализацией поддержки русского языка, пишите мне на почту igor4u@gmail.com и я дам вам его контакты.

I found your details as the administrator of the Ubuntu Russian translators list and wondered whether such a project might be of interest.

I have written "eSpeak", an open source text-to-speech synthesizer which has recently been included for Ubuntu "Edgy". In addition to English, I have started the implementation a few other languages which I hope to improve with assistance from native speakers. The project is at: http://espeak.sourceforge.net/

Russian would also seem to be a good choice to add. I know nothing of Russian, except what I can read at places like http://en.wikipedia.org/wiki/Russian_...

I have a question. Russian spelling-to-sound seems regular, which is good, but it seems that which syllable of a word has the main stress varies, and cannot be found from the spelling. Some languages have regular stress position (eg, next-to-last syllable in Polish) or they mark stressed syllables with accent marks. But not Russian.

In Russian, must the stress position of every word be learned separately?

In English also, the stress position can vary, but the default is the first syllable of a word, and there are some rules (some prefixes are unstressed, some suffixes take the stress or put the stress on the previous syllable). Nevertheless there are many exceptions.

What is the situation with Russian? Does a text-to-speech engine need a dictionary of all the words in the language in order to look up the stress position? If so, does a free machine-readable list exist? Or are there some rules (or at least generalizations) which would limit the number of exceptions?

If you know anyone who would be interested in helping with a Russian speech synthesizer, please let me know. I can set up an initial attempt at Russian which others could work on to improve, see: http://espeak.sourceforge.net/add_lan...

>>> Добавление поддержки русского языка в синтезатор



Проверено: Pi ()
Ответ на: комментарий от anonymous

"Синтезатор русской речи" - понятно

Замечательно, именно это и создает автор.

"Синтезатор русской речи для Linux" - странно

Создает под линуксом, но портировать будет легко - тут главное алгоритмы а не работа с устройствами. Так что не важно.

"Синтезатор русской речи для Ubuntu" - полный бред.

Согласен. Но выбору убунты как платформы для обкатки - самое то.

Кто-то спрашивал в чем проблема в письме. Да именно в у дарениях, автор спрашивает, есть ли правила для сраного ударения. А если нет, то есть ли словари с ударениями.

anonymous
()
Ответ на: комментарий от anonymous

> А если нет, то есть ли словари с ударениями.

Я уже давал ссылку на такой словарь, см. выше по треду

JB ★★★★★
()
Ответ на: комментарий от anonymous

Очевидно, что необходим словарь ударений.

Например, Орфографический словарь под ред. проф. Лопатина http://dict.buktopuha.net/data/lop1v2.zip

Правда там в словах, содержащих Ё (yo) ударение не указано.

Может ещё какой-то словарь есть. Возможно, необходим ещё и словарь личных имён/географических названий.

Если автор собирается обойтись вообще без словарей, то не уверен, что у него это получится. Скорее всего, общие правила если и существуют, то весьма нетривиальны и главное непонятно как это всё конфигурировать.

Словарь, содержащий около 150,000 основ и около 4 млн словоформ http://linguist.nm.ru/stemka/stemka.html занимает порядка 2 МБ. Там правда, немного урезанная версия. Нет слов на П и Р. Кроме того, личных имён и географических названий немного.

Ещё интересные ресурсы:

http://www.aot.ru Open source project http://ruscorpora.ru Нац. колрпус русского языка

pablott
()
Ответ на: комментарий от pablott

> Правда там в словах, содержащих Ё (yo) ударение не указано. насколько я помню, в словах с "ё" ударение всегда падает на эту букву.

anonymous
()
Ответ на: комментарий от pablott

> Правда там в словах, содержащих Ё (yo) ударение не указано.

насколько я помню, в словах с "ё" ударение всегда падает на эту букву.

anonymous
()
Ответ на: комментарий от KA6AH

Замечание насчёт буквы Ё было добавлено для иностранцев, чтобы они не удивлялись, глядя на файл, почему не указано ударение.

pablott
()
Ответ на: комментарий от KA6AH

> звёздолёт =)

Не шути так, нето ещё кто-нибудь поверит

abcypd
()
Ответ на: комментарий от KA6AH

>звёздолёт =)

это у тебя от слова звЁзда??? ;)))

AcidumIrae ★★★★★
()
Ответ на: комментарий от home_user

А чем не катит multitran? multitran.ru multitran.sourceforge.net.

anonymous
()
Ответ на: комментарий от KA6AH

> звёздолёт =)

Звездолёт, грамотей хренов! :)

Skull ★★★★★
()
Ответ на: комментарий от anonymous

>Кто-то спрашивал в чем проблема в письме. Да именно в у дарениях, автор спрашивает, есть ли правила для сраного ударения. А если нет, то есть ли словари с ударениями.

Народ, я сам в русском языке делаю ошибки, но кое-что я знаю: существует такая вещь -- "Орфографический словарь"

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.