LINUX.ORG.RU

Stardict + словари Lingvo


0

0

У кого-нибудь отображается транскрипция?
Делаю так. Беру LingvoUniversalER.lsd, конвертирую в .dsl (хакнутый DslComp), после удаляю ссылки на звуковые файлы скриптом:

iconv -f utf16 -t utf8 $1.dsl | sed -r s/\\[s\].+\.wav\\[\\/s\]// > $1.dsl.utf8
iconv -f utf8 -t utf16 $1.dsl.utf8 > $1.dsl
rm -f $1.dsl.utf8

(скрипт взят не помню с какого сайта)

После чего использую makedict:

./makedict -i dsl -o stardict LingvoUniversalER.dsl

В stardict в транскрипциях кракозябры.
anonymous

пошли сконверитрованный словарь разрботчику makedict - см поиск тут он сам предлагал этот баг исправить

SI ★★☆☆
()

Может кто знает как скрипт поумнее навоять Чет не очень нравится гонять через iconv.

anonymous
()
Ответ на: комментарий от anonymous

>Может кто знает как скрипт поумнее навоять Чет не очень нравится гонять через >iconv.

Через iconv гоняется чтобы sed использовать,
можно:
а)использовать редактор поддерживающий utf-16 и имеющий возможности схожие с sed
б)поправить makedict, чтобы не нужна была эта правка

А с транскрипцией проблема, потому что весь словарь в кодировке X(utf-16),
а транскрпций в кодировке Y(IPA), а т.к. makedict условно говоря делает,
DSL -> utf-8, то транскрипция портиться, см.

http://www.linux.org.ru/profile/fghj/view-message.jsp?msgid=1555253

fghj ★★★★★
()
Ответ на: комментарий от anonymous

>Может кто знает как скрипт поумнее навоять
>Чет не очень нравится гонять через iconv.
Я конвертил без обработки скриптом, а потом в hex-редакторе заменил тэги звуковых файлов (на них ругался гтк) на тэги курсива <i>.
Т.о. в статьях остались упоминания о файлах вида "hello.wav", так что при желании их можно даже найти и прослушать.

Tayler ★★
()
Ответ на: комментарий от Tayler

В stardicte как я понял слова произносятся по совпадению - т е слово hello произносится если есть файл hello.wav и т п ...

так что слова произносятся на все словари ...

SI ★★☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.