LINUX.ORG.RU

Распознавание матана


0

1

Вход: бумажные конспекты лекций со всяко-разно матаном.
Выход: эти же конспекты в LaTeX (на крайняк распознанный ps, png, etc).

Чем такое можно провернуть?



Последнее исправление: JN (всего исправлений: 1)

Помнится, мой сосед по комнате такое проворачивал. Руками.

rival ★★
()

Нанять китайцев? :)

Eddy_Em ☆☆☆☆☆
()

>Вход: бумажные конспекты лекций ...

Выход: эти же конспекты в ... png.

Чем такое можно провернуть?


Сканером?

schizoid ★★★
()
Ответ на: комментарий от power

Еще успеем человека проэксплуатировать. Интересуют программные средства.

JN
() автор топика

Либо я чего-то недопонял, либо ТС не знает о сканерах/цифровых фотоаппаратах.

f1xmAn ★★★★★
()
Ответ на: комментарий от JN

PNG - это просто картинка.

Рукописный текст, насколько я знаю, ещё не умеют распознавать.
Да формулы матановые - не самое приятное для OCR систем.
Проще всего - FineReader'ом: если почерк ровный, половину символов он распознает, остально править ручками.

schizoid ★★★
()

Сомневаюсь, что существует система, которая распознает корректно формулы. Даже если существует, то в любом случае придётся много править ручками, проще самому всё заново напечатать. А вообще, вам так обязательно нужно получить распознанный текст? Если он красиво написан, то его и распознавать не надо, и так приятно читать, а если написано криво, то никто вам его и не распознает. Или уйдут на это сотни времени, когда конспекты станут неактуальными.

P. S. Поскольку мне по роду учёбы приходится постоянно орудовать многоэтажными формулами, то я почти все работы оформляю вручную, ибо от руки написать такие формулы гораздо удобнее и быстрее, чем в любом редакторе.

eugeno ★★★★★
()

Лучший автоматический распознаватель рукописного текста, а тем более формул - это десяток индусов, знакомых с матаном и русским языком.

drull ★☆☆☆
()

А не проще оцифровывать лекции по мере поступления информации? Набрать в латехе одну лекцию нетрудно, заодно и материал во время семестра поучите.

unanimous ★★★★★
()

В общем всё ясно. Спасибо всем. Думал, что если написано понятным почерком, то с распознанием проблем не возникнет, и есть какая-то известная годная тулза, которая в этом поможет.

Попробую на днях InftyReader и FineReader, если не подойдет, то пойду за китайцами/индусами/соседом rival'а...

JN
() автор топика
Ответ на: комментарий от eugeno

> А вообще, вам так обязательно нужно получить распознанный текст? Если он красиво написан, то его и распознавать не надо, и так приятно читать

Если распознать какое-нить дифференциальное уравнение, написанное от руки - а потом правильно его распарсить - его можно потом решить. И всё автоматически... всё сделает компьютер. Например, человек смартфоном фоткает уравнение - отсылает картинку на сервер, на сервере (довольно мощном) она распознаётся, парсится и решается...

Кучу времени можно сэкономить ;)

Так что на вопрос «зачем?» - ответов множество, применение найдёт. Беда только в том, что до этого пока далеко :(

BattleCoder ★★★★★
()

Готового решения (пока) нет. Если есть желание запилить своё - рекомендую начать с книжки авторов Дуда, Харт «распознавание образов и анализ сцен», гуглится на раз ;)

приятного чтения.

BattleCoder ★★★★★
()
Ответ на: комментарий от BattleCoder

Если распознать какое-нить дифференциальное уравнение, написанное от руки - а потом правильно его распарсить - его можно потом решить. И всё автоматически...

А потом автоматически принять решение о том, что человечество приносит только вред планете и его нужно уничтожить.

shutty
()
Ответ на: комментарий от Nxx

зачем так категорично? наработки в этой области есть. _рабочего_ распознавателя рукописного шрифта _пока_ не существует.

fixed.

BattleCoder ★★★★★
()
Ответ на: комментарий от shutty

Надо поменьше смотреть этих терминаторов ;) искусственный интеллект можно использовать и во благо, если с этим не перестараться.

BattleCoder ★★★★★
()

А печатные формулы сейчас какие инструменты умеют распознавать и перегонять в ТеХ?

Вроде и печатные-то мало кто умеет. А тут рукописные.
Проще нанять человека, который сразу будет конспектировать в ТеХ. :)

zhuravlik ★★★★
()
Ответ на: комментарий от BattleCoder

Я думаю, слово «пока» можно смело выбрасывать :)

По крайней мере, в течение ближайших лет 30-ти вряд ли такое появится. А если и появится, то только для каких-нибудь суперкомпьютеров, но никак не персоналок.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Nxx

Так то ж в матрице. В мире машин-то наверняка что-то имеется, а?

dnoskov
()
Ответ на: комментарий от Eddy_Em

Я же объяснил очень простую схему. Человек фоткает на смартфон... фотка жмётся в какой-нить монохромный jpeg или png (не знаю, в зависимости от того, что меньше весит), отсылается на сервер (занимает секунды), а уже сервер (сверхмощный и сверхдорогой, задействует ещё целый кластер) всё делает хорошо и отсылает ответ обратно на смартфон.

Разумеется, пользование ресурсами дорогостоящего сервера незабесплатно и не каждому =) по крайней мере в более близкой перспективе.

BattleCoder ★★★★★
()
Ответ на: комментарий от BattleCoder

Мечтайте, мечтайте, батенька. Мечтать не вредно.

// знаю, сам студентом был и мечтал иметь исходники лекций. Да и многие преподаватели, не знакомые с компьютером, мечтают, как бы их рукописные лекции «автоматом» приняли человеческий вид.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от deterok

Это все равно, что сказать: «Смотри: птицы же летают! Значит, проблема космической авиации решена!»

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от deterok

Т.е ты предлагаешь самому написать систему распознавания рукописного ввода с формулами на основе поста с одного маргинального ресурса?
Мда, а я и не думал, что такие бывают. Почитал бы тот пост, хоть бы.

А по теме: конечно вряд ли что-то выйдет, но если и пробовать, то файнридером. Хотя прозреваю, что вместо формул будет неясная каша.

Number_Seven
()
Ответ на: комментарий от Number_Seven

Исходники там валяются, остается в них разобраться используя статью и написать свое приложение.

deterok ★★★★★
()
Ответ на: комментарий от deterok

Неправильное. Такую чепуху можно быстренько на связке cuneiform + scilab сварганить. Вот только на каждой «неожиданной» формуле будет затык.

Eddy_Em ☆☆☆☆☆
()

помнится, в «big bang theory» была серия, где эти два нерда написали похожую тулзу.

Andersen ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.