Что лучше использовать для распознавания текста в десктопных целях(то есть, не распознавание картиночного спама в МТА, и для других применений на сервере)? FineReader под Wine, или tesseract, cuneiform?
cuneiform -l rus -o 1.txt out.bmp
Где out.bpm конвертированный image magick (просто convert out.pnm out.bmp) скан с помощью xsane с дефольтными настройками создает пустой файл 1.txt, не выводя никаких ошибок
а
tesseract out.png out_.txt -l rus
Создает UTF-8 текстовый файл с текстом, только распознанным совершенно не верно.
Может быть, нужны какие-то специфические настройки для сканера? Изображение по-умолчанию со сканера пожалуй особенной контрастностью не страдает.