LINUX.ORG.RU

PHP - чисто теоретический вопрос


0

0

Привет всем. В данный момент изучаю PHP, он мне нужен для написания ньюз - граббера под движок е107. В общем возможно ли на PHP:
1) Получить HTML код странички
2) Отрезать из кода все лишние таблицы, ибо нужные данные находятся только в 1 таблице
3) Убрать из кода тэги и лишний мусор типа: <p>, <BR> <img src=... >, <a> и прочие
Если все это возможно реализовать на PHP, то посоветуйте что почитать / и вообще куда смотреть. Спасибо.

anonymous

все можно.

но я подобное предпочитаю делать на perl`е ;]

galchyonok ★★
()

Перегнать код в валидный XML, наложить XSLT. В PHP должны быть средства для работы с этими вещами.

Sphinx ★★☆☆
()
Ответ на: комментарий от Sphinx

> Перегнать код в валидный XML, наложить XSLT. В PHP должны быть средства для работы с этими вещами.

Боже, зачем так замарачиваться. На перле это в 10 строк укладывается. А может и того меньше. Делов-то дёрнуть страничку да пару-тройку раз regexp'ом пройтись.

Anoxemian ★★★★★
()
Ответ на: комментарий от VirRaa

Нагуглил много материала на тему работы со строками. Собственно если кого не затруднит, ответьте на вопрос: как загнать код HTML странички в строковую переменную. Спасибо.

anonymous
()
Ответ на: комментарий от KRoN73

Спасибо Вам всем за советы. Премного благодарен.

anonymous
()

Можно, только не надо.

Miguel ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.