есть pdf -
зогдачка минимизировать размер pdf ибо программа генерирующая потоки создания страниц - настолько мусорна что даст 100 очков в перёд легендарной способности ворда экспортировать в html
т.е нужно оптимизировать построение страниц имея на выходе тот же отпечаток
вот какие есть инструменты?
на данный момент есть костыльное:
cpdf -decompress in.out -o m.pdf
myUkur.py m.pdf m_ukur.pdf
cpdf -squeeze m_ukur.pdf -o out.pdf
где в myUrkur попытка викинут эвристиками из текстовых потоков управления выводом команды которые дублирируются -например повтор одного и тогоже действия которое ничего не меняет;
избыточные сохранения востановленния графического состояния т.е последовательностей q и Q в перемешку
слияние в одну команду печать идующих подряд с одинаковыми параметрами текстовых строк например TJ идущих подряд выводящих массивы отдельных символов с выставлением идентичных свойств и этих строк - сворачивание в одну команду с одной строкой
удаление промежуточных пар ET … BT - если команды … не влияют на тексты по соседних блоках