LINUX.ORG.RU

scribd, сохранение оффлайн копии

 scribd


0

1

Кинул тут ссылку человеку на https://ru.scribd.com/read/264126959/The-Software-Test-Engineer-s-Handbook-2n... а потом задумался, какого, собственно, хрена: текст книги доступен +/- бесплатно, жмотов правообладателей мы презрим, хочется оффлайн в нормальном формате

inb4:

«сохранялки» со scribd такое не умеют

на странице куча абсолютно шизофренического js и такого же html, лайфхаки с фаирбагами не работают

выдранная уже не помню как ссылка на https://ru.scribd.com/store_purchase/create?item_id=264126959 говорит «нет, мы не можем продать этот документ»

Варианты у меня:

очевидный, которым я воспользуюсь только потому что бумажка сертификата нужна и хочется освежить знания перед экзаменом - копипаст по мере чтения

топорный: натравить сначала какойнить webdriver, который будет листать и делать скрины, потом имеджмэджиком склеить их в большой pdf и попытаться распознать

топорный-2: не скринить и распознавать, а выделять все от угла до угла, сохранять и потом проходиться парсером на чем-нибудь, чтобы получить plaintext

шожеделоць?

★★★☆

Последнее исправление: vostrik (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.