LINUX.ORG.RU

Не знаю, есть ли, но можно написать при помощи OpenCV. Тебе же толщину линий определять там?

Quasar ★★★★★
()
Ответ на: комментарий от Anonymous

Нет, не штрихкодов, а чеков кассовых.
На них штрихкодов-то и нет.
Интеграция с GNUcash приветствуется.

shimon ★★★★★
() автор топика

Да его просто полно!

$ yaourt -Ss OCR
extra/ocrad 0.21-2 [installed]
    An Optical Character Recognition program
community/cuneiform 1.1.0-2 [installed]
    Linux port of an OCR system developed in Russia. Supports more than 20 
    languages.
community/gocr 0.49-2
    Open-source character recognition (OCR)
community/kaudiocreator 1.3-2
    A program for ripping and encoding Audio-CDs, encoding files from disk
community/ocrfeeder 0.7.9-1
    GTK+ document layout analysis and optical character recognition application
community/tesseract 3.01-1
    An OCR programm
community/xmoto 0.5.9-2
    A challenging 2D motocross platform game, where physics play an important 
    role.
community/yagf 0.9.1-1
    QT4-based GUI for Cuneiform OCR
aur/bdf-bitocra 1.1-1 (7)
    A monospace bit font, inspired by OCR-A. Created to be very readable on 
    small sizes
aur/cuneiform-qt-git 20120301-1 (47)
    QT4-based GUI for Cuneiform OCR
aur/cups-ocr 0.1.2-1 (1)
    Print directly to a tiff file which feeds an OCR engine which will output 
    a text file. Modelled after cups-pdf.
aur/djvubind 1.2.0-1 (4)
    A tool to create highly compressed djvu files with ocr, metadata, and 
    bookmarks
aur/djvubind-hg 1.2.0-1 (2)
    A tool to create highly compressed djvu files with ocr, metadata, and 
    bookmarks
aur/djvuocr 0.1-1 (4)
    Do optical character recognition(OCR) with djvu files
aur/exactimage-svn 1818-1 (18)
    A fast, modern and generic image processing library, including hocr2pdf 
    and other utilities
aur/eyeocr 0.0.10-1 (2)
    Java-based text (ocr) recognizer
aur/fuzzyocr-svn 142-1 (2)
    plugin for SpamAssassin which scans images
aur/gimagereader 0.9-2 (64)
    A graphical GTK frontend to tesseract-ocr
aur/haskell-procrastinating-structure 1.0.1-4 (0)
    Pure structures that can be incrementally created in impure code
aur/haskell-procrastinating-variable 1.0.2-4 (0)
    Haskell values that cannot be evaluated immediately.
aur/hocr 0.8.2-1 (Out of Date) (4)
    HOCR is a Hebrew character recognition c/c++ library.
aur/kaudiocreator3 3.5.10-2 (6)
    KDE3 CD ripper and audio encoder frontend
aur/libhocr 0.10.17-15 (0)
    HOCR is a Hebrew character recognition library. libhocr comes with 
    sane-pygtk
aur/lockout 0.2.3-2 (2)
    Temporarily scramble your root password to combat procrastination
aur/nhocr 0.19-1 (4)
    NHocr is a command line OCR (Optical Character Recognition) program for 
    Japanese language, etc.
aur/ocr-a-font 10-1 (15)
    Free version of OCR-friendly sans-serif monospace TTF font described in 
    'ISO 1073-1:1976' , 'ANSI X3.4-1977. X3.4' and 'DIN 66008' standarts
aur/ocr-b-font 1-1 (3)
    Free version of OCR-friendly sans-serif monospace TTF/OTF font described 
    in 'ISO 1073-2' standard
aur/ocre 0.033-1 (17)
    Reads an image file and writes ASCII or Unicode characters
aur/ocrgui 0.2.2-1 (17)
    A GUI for OCR programs. 
aur/ocrodjvu 0.6.1-1 (Out of Date) (2)
    ocrodjvu is a wrapper for OCR systems, that allows you to perform OCR on 
    DjVu files.
aur/ocropus 0.4.4-2 (Out of Date) (69)
    State-of-the-art document analysis and OCR system
aur/ocropus-hg 14-2 (13)
    An OCR system for documents and books
aur/ocropy 0.4.4-1 (0)
    Python part of OCRopus: top-level scripts
aur/ocropy-hg 111-1 (2)
    Python part of OCRopus: top-level scripts
aur/ocroswig 0.4.4-1 (0)
    Python bindings for iulib and C++ part of OCRopus
aur/ocroswig-hg 180-1 (2)
    Python bindings for iulib and C++ part of OCRopus
aur/pdfsandwich 0.0.3-4 (7)
    Wrapper for cuneiform OCR and hocr2pdf to generate pdf files with the 
    recognized text put behind the image (sandwich pdfs).
aur/perl-catalyst-plugin-autocrud 0.68-1 (Out of Date) (2)
    Instant AJAX web front-end for DBIx::Class
aur/perl-mojolicious-plugin-docrenderer 2.00-2 (1)
    Browses online documentation of your Mojolicious application
aur/procrastinate-no-more-plasmoid 0.2-2 (7)
    Plasmoide to keep you from procrastinating
aur/python2-tesseract-svn 203-1 (1)
    python wrapper class for tesseract OCR
aur/rocrail-bzr 1566-1 (0)
    Rocrail - Model Railroad Control System
aur/tesjeract 0.3.2-1 (0)
    A Java JNI wrapper for the Tesseract OCR engine
aur/tesseract-polish-svn 35-1 (8)
    High quality data files for Polish language support for Tesseract OCR.
aur/tesseract-svn 639-1 (74)
    An OCR Engine that was developed at HP Labs between 1985 and 1995
aur/tesseract2 2.04-1 (1)
    Legacy version of the Tesseract OCR Engine
aur/timeclock-git 20091020-1 (5)
    a simple utility for people who suffer from excessive procrastination or 
    distractibility
aur/xmoto-svn 3403-1 (18)
    A challenging 2D motocross platform game, where physics play an important 
    role in gameplay. Developement version.
aur/xsane2tess 1.0-4 (47)
    Script for OCR with tesseract and xsane
CYB3R ★★★★★
()
Ответ на: комментарий от derlafff

С сайта проекта можно загрузить пробную версию, которая позволяет бесплатно распознать 100 страниц за 10 дней. Стоимость коммерческой версии составляет 149 евро с ограничением в 12 тыс. страниц в год и 999 евро с ограничением 120 тыс. страниц в год.

Чтобы загрузить триал, нужно заполнить анкету, ага.

CYB3R ★★★★★
()

cuneiform-linux
но «открытость» - это его единственное преимущество. там всё печально. и вообще в этой области всё печально.

попробуй tesseract, но его учить надо. не думаю, что есть уже базы на такой фонт, как на чеке.

aol ★★★★★
()

ЕМНИП, в самой лептонике, на которой cuneiform базируется, был пример распознавалки штрих-кодов.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от shimon

Нет, не штрихкодов, а чеков кассовых.

?? А чего там распознавать?

Или хочешь домашнюю бухгалтерию автоматизировать: считать, сколько в месяц на пивко тратишь?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Я cuneiform'ом недавно pdf'ки без слоя OCR распознавал. Очень даже прилично.

Eddy_Em ☆☆☆☆☆
()

Одно время искал именно для кассовых чеков. По качеству все сливают. Что cuneiform, что tesseract.
Может быть, файн-ридер бы справился..

basp
()
Ответ на: комментарий от vostrik

QR, во всяком случае на n900, распознается нормально.
а разница, по сути, только в том, что в QR границы четко заданы, но и тут ничто не мешает вручную определить границы распознаваемого текста

seed_stil ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.