Ищу библиотеки, которые позволят вытащить из pdf,doc,docx,xls,xlsx текст без разметки.
Грубо говоря на входе - файл, на выходе все видимые открывшему этот файл спец.программой слова через пробел.
0) Сами библиотеки должны быть написаны на php
1) PEAR не предлагать
2) Редкие php-расширения, ставящиеся не на каждый хостинг - не предлагать.