LINUX.ORG.RU

Распознавание казахского языка

 , , , ,


0

1

Поставил tesseract-ocr, мордочку в виде gImageReader. Напрягает отсутствие казахского языка как такового. Начал учить tesseract языку, но на команде

 unicharset_extractor ccc.eee.exp0.box 
вылезла ошибка: мол, нет такой команды. Ну и пока накрылся процесс. Кто что посоветует? Может есть возможность добавить язык в gImageReader? Ещё: нужен казахский словарь для tesseract.

Мне кажется, казахский нормально умеет только Finereader

Deleted
()

кстати, если еще раз встретите того парня, который спрашивает, что бы такого написать под этот ваш, то можно посоветовать ему написать хоть один работающий, юзабельный, расширяемый OCR (бэкенд+фронтэнд).

redhat
()
Ответ на: комментарий от Deleted

А это в вашем языке есть буква Қ? И звучит она как-то странно, то ли «кё», то ли «кы», язык сломаешь, одним словом.

anonymous
()
Ответ на: комментарий от anonymous

А это в вашем языке есть буква Қ?

Да, я не спец в лингвистике, но звучит почти как буквы Х и К вместе взятые.

Буква Ә есть еще и в татарском. В свое время очень удивился, увидев знакомые буквы в нем.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от Deleted

Родственные языки ведь, тюркские оба, по идее ближе друг к другу чем русский и украинский, должны быть хорошо взаимопонятны.

anonymous
()
Ответ на: комментарий от anonymous

по идее ближе друг к другу чем русский и украинский

Не ради политики сказано, посмотрите это видео:
https://www.youtube.com/watch?v=MXJBBt_6mqs
на экране - Стив Кауфманн, основатель LingQ и полиглот. Знает много языков, в т.ч. русский и украинский, как я понял. Послушайте (включите субтитры) - узнайте что он говорит о родстве украинского и русского.

xoomer
()
Ответ на: комментарий от xoomer

Дядя Стив понравился. Очень деликатный :)

Deleted
()
Ответ на: комментарий от darkenshvein

при чём тут locales? tesseract ведь с выбором языка распознаёт.

Synthez
() автор топика

пойдём по пунктам... на третьем шаге здесь вылетает

unicharset_extractor: команда не найдена 
кто сталкивался, как исправить?

Synthez
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.