LINUX.ORG.RU
ФорумTalks

Оцифровка скана книги


0

1

Имеется отсканированная книга 60-х годов. Хочу превратить ее в нормальный текст для последующего чтения на электронной книге.
Все pdf превратил в png с помощью gscan2pdf, текст замечательно распознает YAGF. Вопрос - что дальше делать с этим текстом? В какой формат проще всего конвертировать книгу, чтобы потом не проделывать двойную работу вроде деления абзацев и обозначения заголовков? Какой софт юзать?

★★★★★

Если гуманитарщина, то fb2, если с формулами и схемами, то даже не знаю. Может и правда LaTeX, как выше советовали.

Sociopsih ★☆
()
Ответ на: комментарий от Sociopsih

Нет, никаких формул/схем, просто текст. А для fb2 что использовать? Обычный LibreOffice с плагином или есть что-то кошернее?

ArtKun ★★★★★
() автор топика
Последнее исправление: ArtKun (всего исправлений: 1)
Ответ на: комментарий от ArtKun

Я как-то интересовался темой, но там все сложно. Мне проще сканы в djvu гонять и на компе читать. Могу только ссылку дать на вики.

Sociopsih ★☆
()
Ответ на: комментарий от ArtKun

Обычный LibreOffice с плагином это и есть самое кошерное на сегодняшний день.

Motif ★★
()
Ответ на: комментарий от ArtKun

Нет, никаких формул/схем, просто текст.

А что тогда мешает оставить в виде плоского текста? Как вариант можно на флибусту залить, возможно помогут с вычиткой и перегоном в fb2.

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от DNA_Seq

В каком смысле? Вообще-то я сам хочу все проверить и исправить ошибки.
Только вот latex не осилил.

ArtKun ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

Ну так книга мне самому интересна, почему бы и не почитать... а вообще я ее все равно собираюсь сразу же выложить, так что проблем с этим не должно быть.

ArtKun ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

У меня неограниченное количество времени :)
А страниц всего 115.

ArtKun ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

И да, а в чем разница? Читаю, нахожу ошибки распознавания и на ходу правлю. К тому же большинство, если не все, подчеркивает сам LibreOffice.

ArtKun ★★★★★
() автор топика
Последнее исправление: ArtKun (всего исправлений: 1)
Ответ на: комментарий от DNA_Seq

Тайлинг же! Первая половина экрана - скан, вторая - libreoffice.

ArtKun ★★★★★
() автор топика
Ответ на: комментарий от DNA_Seq

Дык удобно же. Для худлита то и делай, что \section да \subsection расставляй. И не надо больше ничего

Siado ★★★★★
()
Ответ на: комментарий от ArtKun

Автопроверка орфографии в любом текстовом редакторе сейчас есть.

Siado ★★★★★
()

Для Libre и Open есть расширение OooFBTools для обработки и конвертации в fb2. Сам, правда, совсем немного его использовал, и то не для перегонки в фб2, а для обработки кривого текста.

KOV ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.