LINUX.ORG.RU
ФорумJob

Требуется: найти софт для обработки PDF (оплата от 20к)

 , , , ,


4

4

Здравствуйте.
Требуется человек, который живет в линуксе(debian) и без труда подберет софт для обработки pdf файлов, а именно:
–Сжатие PDF
–Разделить PDF
–Объединить PDF
–Конвертировать PDF в Word
–Конвертировать PDF в Excel
–Конвертировать PDF в PPT
–Конвертировать PDF в JPG
–Конвертировать Word в PDF
–Конвертировать Excel в PDF
–Конвертировать PPT в PDF
–Конвертировать JPG в PDF
–Подписать PDF
–Cнять защиту PDF
–Удаление пароля, шифрования и разрешений из файла PDF
–Защитить PDF

Весь софт необходимо будет разместить в докер для дальнейшее общения с веб интерфейсом.
Оплата сдельная- 20000р прошу не обжаться если это мало, мне сложно оценить реальную стоимость поэтому предлагайте вашу цену.
Работа сдельная, но на этом сотрудничество не закончится т.к регулярно возникают подобные задачи.
Контакты для связи, телеграм: hostlime



Последнее исправление: hostlime (всего исправлений: 2)
Ответ на: комментарий от fernandos

Вполне возможно что есть. Нужен человек, который все это проверит и соберет в докер.

hostlime
() автор топика


–Конвертировать PDF в Word
–Конвертировать PDF в Excel
–Конвертировать PDF в PPT


Это делает finereader, закрытый и дорогой софт под оффтопик,
а всё остальное - GhostScript. В любом случае, очень маленькая оплата.

Shadow ★★★★★
()
Последнее исправление: Shadow (всего исправлений: 1)

Конвертировать PDF в Word

Самая лучшая реализация, когда речь идет о PDF с настоящим текстом – на сайте Adobe. Естественно, проприетарная. Но русский текст в картинках распознается крайне плохо и шрифты в сгенерированном документе донельзя уродливые.

FineReader с русским языком и шрифтами справляется лучше, но полученный документ, отформатированный чуть сложнее, чем книга, расползается при редактировании, потому что колонки стали строками с табуляцией, строки с табуляцией – колонками, надписи с рамкой – обычными строками на фоне векторного прямоугольника и т. д.

Два разных конвертора обычно прикрутить нельзя, что большинство юзверей – нубы, которым нужно, чтобы всё работало.

–Конвертировать Word в PDF –Конвертировать Excel в PDF –Конвертировать PPT в PDF

Правильно это сделает только решение на основе MS Office, кое-как – на основе Либры.

Оплата сдельная- 20000р прошу не обжаться если это мало, мне сложно оценить реальную стоимость поэтому предлагайте вашу цену.

Заплати кому-нибудь 2–5 тыров за ресерч и консультацию. Дальше придется решать, какой бесплатный софт прикрутить (часть озвученных операций я регулярно проделываю в командной строке), какие SaaS закупить, что разработать, от чего отказаться.

Bagrov ★★★★★
()
Последнее исправление: Bagrov (всего исправлений: 1)
Ответ на: комментарий от Shadow

У меня нет претензий к качеству распознавания символов. Я о том, что распознавание структуры документа можно и нужно улучшать.

Bagrov ★★★★★
()
Ответ на: комментарий от Bagrov

Спасибо за подробный ответ. ДА, вы правы - сначала нужно поресерчить интернет и найти оптимальное решение, а потом уже все отлаживать. Судя по всему у Вас большой опыт, а Вы могли бы помочь с моей задачей ?

hostlime
() автор топика
Ответ на: комментарий от hostlime

У меня большой опыт прикладного жонглирования в консоли и некоторый интерес к IT в целом. Чтоб помочь еще больше, добавлю чуть больше конкретики о том, чем пользуюсь лично я:

Разделить PDF

pdfsplit

Объединить PDF

pdfunite

Конвертировать (Word|Excel|PPT) в PDF

Я использую Word, Excel, PowerPoint. Просто открываю и сохраняю в pdf.

Конвертировать JPG в PDF

img2pdf (быстро), convert (медленно). Обе утилиты оптическим распознаванием не занимаются и просто делают страницы из картинок.

Что касается предложения сотрудничества, всё зависит от сроков проекта и моих жизненных обстоятельств. Сегодня у меня первый рабочий день на новом проекте: приходится входить в курс дела, а потом еще изучать какие-то материалы. Возможно, в конце недели появится определенность, сколько времени у меня останется. Но сама идея мне нравится. Предлагаю на всякий случай написать пару строк на dmitry@bagrov.info, но поиски нужного человека не прекращать.

Bagrov ★★★★★
()

Конвертировать PDF в Excel

Гемор без вменяемого результата в общем случае. Экспорт в бд бы еще написал.

crutch_master ★★★★★
()

–Конвертировать PDF в Word
–Конвертировать PDF в Excel
–Конвертировать PDF в PPT

Это явно не на 20К.

BceM_IIpuBeT ★★☆☆☆
()
Ответ на: комментарий от BceM_IIpuBeT

Если в валюте, то вполне достаточно для релиза первой версии.

Igron ★★★★★
()
Ответ на: комментарий от Shadow

Так запускаешь безмозглый хромиум, конвертируешь PDF в HTML, а HTML -> %другие форматы%, если картинки, то можно опять же через безмозлый хромиум открыть все и сделать скриншот всего содержимого

tz4678 ★★
()
Ответ на: комментарий от tz4678

конвертируешь PDF в HTML

На минуточку... Ты так уже делал? По шагам покажи.

Особенно если учесть, что обычно пробелы/переводы строки в pdf - это смещение координат векторного объекта «слово». Откуда, собственно, и шуточки про цену работы.

Shadow ★★★★★
()
Последнее исправление: Shadow (всего исправлений: 2)

Задача по прежнему актуальна. Если задача интересна то предлагайте вашу цену. Контакты для связи, телеграм: hostlime

hostlime
() автор топика

Конвертировать PDF в

Тут проблема в том, что pdf это м быть всё, что угодно от нормального текстового документа до набора картинок размером со страницу

Только finereader сможет дать более менее предсказуемый результат.

sergej ★★★★★
()
Ответ на: комментарий от sergej

Созванивался с ними. У них ценник никак не подходит для бесплатного сервиса: https://www.abbyy.com/cloud-ocr-sdk/licensing-and-pricing/ Конкуренты точно не используют их софт. Однозначно существует другое решение.

Кто может помочь в поисках софта? Назовите вашу комфортную цену, лучше сразу в телегу.

hostlime
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.