LINUX.ORG.RU

Сообщения lebo031

 

Создание скрипта в bash для массового переименования отсканированных документов(.pdf)

Доброго времени, форумчани!

В общем, подкинули задачку мне: автоматически переименовать отсканированные документы( сканы сохраняются в .pdf ) в соответствии с данными из самого скана.

Итак, что имеем:

папку со сканами *.pdf ( в папке лежат овер900 pdf-файлов. В каждом pdf есть по несколько страниц, на каждой странице - свой скан );

Задача:

переименовать все *.pdf в соответствии с данными, находящиеся на первой странице этого .pdf-а ( шаблон : номер документа@дата документа@тип документа и город( полное название без номера документа )@номер штрих-кода( на сканированном документе имеется наклейка со штрих-кодом )@440( остаётся без изменений ).pdf ). Пример: 02#35#08@09=08=2018@Акт_проверки_средств_учета_Усолье@0000006637@440

Сложность задачи в том, что сканированные документы не имеют единой структуры( для примера прикрепляю пару образчиков ). Т.е. предположительно, необходимые нам данные будут находиться в разных сегментах скана. Похожую задачу решали тут: bash скрипт+распознавание текста+и массовое переименнование

Так же имеются документы, в которых не указаны какие-то значения из шаблона( например, в некоторых нет номера или даты документа, документ является схемой( что и нужно указать в названии ), дата в виде «месяц-год» ). Пример: БН@БД@Однолинейная_схема@0000004210@440 БН@28=06=2004@Акт_установления_границ_Губаха@00000000901440

Примеры тут: https://dropmefiles.com/i56vC

По вопросам оплаты сюда: lebo031@protonmail.com

 , ,

lebo031
()

Создание скрипта в bash для массового переименования отсканированных документов(.pdf)

Доброго времени, форумчани!

В общем, подкинули задачку мне: автоматически переименовать отсканированные документы( сканы сохраняются в .pdf ) в соответствии с данными из самого скана. Потратив уйму времени на поиск решений аналогичных задач в интернете, понял, что не обойтись без написания скрипта. На вашем ресурсе наткнулся на пост товарища @isaecf с очень похожей задачкой, но применить на практике его решение задачи, с заменой его условий на свои, не получилось. Совсем нет опыта работы с кодированием и написанием скриптов(

Уповаю на местных удальцов и умельцев помочь справиться с этой задачкой.

Итак, что имеем:

  • папку со сканами *.pdf ( в папке лежат овер900 pdf-файлов. В каждом pdf есть по несколько страниц, на каждой странице - свой скан );
  • cygwin( необходимо решить задачку на windows 7 );

Задача:

  • переименовать все *.pdf в соответствии с данными, находящиеся на первой странице этого .pdf-а ( шаблон : номер документа@дата документа@тип документа( полное название )@номер штрих-кода( на сканированном документе имеется наклейка со штрих-кодом )@440( остаётся без изменений ).pdf ).

Буду очень благодарен за помощь!

 , , ,

lebo031
()

RSS подписка на новые темы