LINUX.ORG.RU

Menestrel — приложение для озвучивания текстов на русском языке

 , menestrel, skomoroh,


0

5

Menestrel — приложение для озвучивания текстовых документов, веб-страниц и электронных книг на русском языке, разработанная на основе синтезаторов речи Festival и ru_tts.

Menestrel поддерживает следующие форматы файлов:

  • обычные текстовые файлы с кодировками UTF-8, CP1251, KOI8-R, ISO-8859-5;
  • HTML-файлы;
  • файлы в формате OpenDocument (ODT);
  • файлы в формате Microsoft Document (DOC);
  • файлы в формате FictionBook (FB2)

Файлы всех вышеперечисленных форматов могут быть предварительно помещены в ZIP-архив.

Основные возможности приложения:

  • озвучивание:
    • файлов указанных выше форматов;
    • скопированных и вставленных в поле воспроизведения фрагментов текста;
    • набранных в поле воспроизведения текстов (с возможностью сохранения набранного);
  • отображение произносимого текста в окне программы и выделение произносимого предложения;
  • сохранение при завершении работы и восстановление при следующем запуске позиции маркера, в которой было завершено озвучивание;
  • установка неограниченного числа закладок и переход по ним, поиск текста;
  • импорт произнесённого текста в звуковые файлы формата WAV или MP3 и списка воспроизведения для использования в качестве аудио-книг.

Проект состоит из двух приложений: Menestrel и Skomoroh, разница между ними в том, что Menestrel основан на базе синтезатора речи Festival, а Skomoroh — на базе синтезатора речи ru_tts.

Приложения написаны на С++ с использованием Qt 4.7 в интегрированной среде разработки QtCreator 2.1.

Благодаря кроссплатформенности Festival, Menestrel доступен как в версии для Linux, так и для Windows.
Skomoroh поставляется исключительно для Linux.

Все исходные тексты в виде проектов QtCreator размещены на странице проекта на sourceforge.

Страница проекта на sourceforgre

>>> Официальный сайт проекта



Проверено: post-factum ()
Последнее исправление: adriano32 (всего исправлений: 5)
Ответ на: комментарий от anonymous

> А в чем проблема? Все это давно изучено.

Вот и я спрашиваю: в чём проблема? Если всё давно изучено, где эти программы, позволяющие не думать о собеседнике как о машине? Нет их. Потому что опять: «этим должны заниматься профи». Долго и серьёзно. Я очень сильно сомневаюсь, что ваша «регулярная фонетика» описывается одним предложением. А искажение шипящих? А «е/и»? Смягчения согласных? (заметьте - это говорю я, чайник с 10 классами и тройкой по русскому) Поговорите о фонетике со спецами, узнаете много нового. :)

Помню, у нас в предвыпускном классе одна настойчивая девушка хотела написать программу «шашки». Источником оптимизма послужила шахматная доска, нарисованная на бейсике. Уже тогда мой здоровый скептицизм смешил меня до колик.

matumba ★★★★★
()

Не в качестве критики:

Надеюсь Автор просто удалил комментарии из исходников, заботясь о трафике скачивающих.

Иначе, через некоторое время, и сам Автор уже не сможет разобраться в том, что и как работает.

pas1
()
Ответ на: комментарий от pas1

Вообще - треть текста, это комментарии

rybusha
() автор топика
Ответ на: Скажите пожалуйста, нафига там куте? от rybusha

> Скажите пожалуйста, нафига там куте?

А что надо?

консольное приложение без завязки на куте, даёшь ему проклятый файл, и он тебе его читает. Я так понимаю, что основной плюс программы от простого фестиваля, поддержка распознавания разных кодировок и форматов? Смысл в графической приблуде?

anonymous
()
Ответ на: комментарий от matumba

> Например: «молоко» - ни один симулятор не «дотумкает», что первую «о» произносят чуть ли не как «э» (очень краткую)

Наркоман что ли?

anonymous
()
Ответ на: комментарий от anonymous

а почему вы не запилите свой синтезатор в андроид?

У Андроида swox очень не плох, а голоса Юрий и Светлана- очень не плохи, да приложения для чтения книг с использованием TTS- тоже неплохи, типа fb2reader и MoonReader-Pro. А вот в Linux читалки с TTS не было на момент написания Менестреля.

rybusha
() автор топика
Ответ на: комментарий от anonymous

>основной плюс программы от простого фестиваля, поддержка распознавания разных кодировок и форматов?

Не только, но и нормализация и разбиение текста, а так же , чтоб была возможность почитать глазами, а потом, когда глазами уже нельзя, а узнать что дальше очень хочется, а надо какой-то фигней заниматься, можно в режим TTS перейти- и делом заняться и узнать, что дальше. В консоле можно сделать по образу mc или YaST, но мне проще в Qt, я уже писал, почему.

rybusha
() автор топика

Увидел Qt - забил. Нах. в синтезаторе речи Qt? В stdin текст, в stdout звук. И всё. Ради синтезатора сомнительного качества заводить на сервере X-ы не будут. Эффективнее будет написать bash-скрипт который сделает тоже словарным методом. Ах да, он ж для десктопов. Видать виндузятник бывший.

Все исходные тексты в виде проектов QtCreator размещены на странице проекта на sourceforge.

Репозиторий пуст.

FeyFre ★★★★
()
Ответ на: комментарий от FeyFre

Ах да, он ж для десктопов. Видать виндузятник бывший.

А, ты сопливчик в каком классе, в 5-м. А ты про HP-UX, Solaris или AIX слышал? А я сейчас с этим работаю. А когда ты еще разговаривать не умел- мне пришлось работать с NetWare, UnixWare, SCO Unix, ну и с MsDos. А до этого, когда ты еще не родился- работал с VAX, CP/M, ISIS, а когда твои родители еще были детьми, мне приходилось бегать с перфокартами на ДОС-ЕС(DOS/360) и в ОС-ЕС(OS/360), а когда твои родители еще были в проекте, я работал в МЛ-ОС, на «Минск-32» и вообще без операционной системы, т.к. еще не было такого понятия на «Минск-222». Так, что я большую часть жизни( около30 лет) работал такой командой строке, какая тебе никогда не снилась и поэтому умею ценить и Web-интерфейс и графический интерфейс. Поэтому приходится писать кросс-платформенные управляющие приложения с Web и графическим интерфейсами, что-бы, когда я в отпуске или в командировке, я мог обяснить админом другого круга по телефону, что надо сделать в случае чего, т.к. в командной строке надо работать самому, по телефону не объяснишь. Так то ребенок, не советую ничего презирать, даже Маст-дай.

rybusha
() автор топика
Ответ на: комментарий от FeyFre

Репозиторий пуст.

А, что- просто zip-архив выкачать не умеем? А кто ставит на сервер звуковую систему? А кто работает непосредственно на сервере, как на десктопе? Я например не понимаю, как работать стоя перед стойкой с серверами, при рёве еще тысячи серверов, в холоде кондиционеров перед стоечной, неудобной консолью, кто нибудь будет редактировать документы, проверять и получать почту или слушать книги?

rybusha
() автор топика

Ждём ебылдов!

если уже есть в каком-то оверлее киньте ссылку...

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.