LINUX.ORG.RU

any2txt

 anything2txt,


0

2

Понадобилось сконвертить пачку разных документов в txt (pdf, xlsx, xls, doc, docx и т.д., короче, все что юзера сейвят на файлопомойку). То что можно по расширению/mime посмотреть и запустить соответствующий xxx2txt знаю. Гуглом не нашел. Может есть уже такое, или велосипед писать?

Хм. pdftotext . С xls/doc - там как-то с OpenOffice можно работать через командную строку. Так чтобы any2text - не знаю, скорее всего нужно свой for/switch писать.

Kroz ★★★★★
()

Вы не боитесь глюков с форматированием при конвертации?

я лично сталкивался с тем что у многих научных статей при преобразовании в текст съезжают первые буквы абзацев.

Slackware_user ★★★★★
()
Ответ на: комментарий от Slackware_user

Не боюсь, потому что не стоит задачи получить 100% достоверное преобразование в текст. Если где-то буквы поедут - печально, конечно, но не очень критично.

division_hell
() автор топика
Ответ на: комментарий от DeVliegendeHollander

Есть даже catppt для PowerPoint.

/* сам никогда не пользовался, сейчас случайно обнаружил :) */

DeVliegendeHollander ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.