Обучение OCR Tesseract русскому языку

0

0

На сайте opennet.ru появилась инструкция по обучению Tesseract русскому языку.

Tesseract — программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет "пролежавшая на полке". Не так давно Google купил её и открыл исходные тексты для продолжения разработки. В настоящий момент программа уже работает с UTF-8, но знает только английский, немецкий, французский, испанский, итальянский и голландский языки.

Руководство по обучению русскому языку: http://www.opennet.ru//base/rus/osr_t...

Руководство по обучению программы (на английском): http://code.google.com/p/tesseract-oc...

Страница Tesseract: http://code.google.com/p/tesseract-ocr/

>>> Группа tesseract-ocr-russian в группах Google

Ссылка

←	EuroBSDCon 2007: закрытие.

Вышел wine doors 0.1.1

→

← 1 2 →

Ответ на: комментарий от magesor 15.09.07 15:11:47 MSD

> А пока такой возможности нет, ABBYY может взять свои виндовые "вкусности", свернуть их трубочкой и засунуть обратно в свою шикарную задницу.

+1 ABBYY игнорирует Linux - пользователи Linux игнорируют продукты ABBYY. Этот файнридер итак-то практически не нужен, а благодаря политике компании нужен еще меньше количеству пользователей.

anonymous
(17.09.07 03:56:41 MSD)

Ответ на: комментарий от anonymous 17.09.07 03:56:41 MSD

s/меньше/меньшему/

anonymous
(17.09.07 03:58:41 MSD)

Ссылка

Ответ на: комментарий от yk4ever 15.09.07 23:19:09 MSD

> Пробовал тессеракт. Имею сказать - говно. К реальному использованию непригоден. Ждём, пока у гугля дойдут руки.

Думаю, они прикрутят его как вебсервис.

anonymous
(17.09.07 04:02:49 MSD)

Ссылка

Пробовал Тессеракт — говно редкостное, даже английский courier не умеет распознавать. В качестве альтернативы можно воспользоваться гуглем: выложить пдфку на свой сайт, пару неделек подождать, пока гугле не проиндексирует и не распознает эту пдфку, после чего качать распознанный текст.

annoynymous ★★
(17.09.07 09:52:11 MSD)

Ссылка

Ответ на: комментарий от magesor 15.09.07 15:43:13 MSD

На основе его есть гуевое приложение под МСВС.

anonymous
(20.09.07 02:55:38 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	EuroBSDCon 2007: закрытие.

Open Source

Вышел wine doors 0.1.1

→

Похожие темы