Недавно была уже тема где разгорелся спор на тему стоит ли парсить HTML regexp'ами:
preg_match_all выражение (комментарий)
Лично я отписался что зачастую использовать regexp удобнее чем сторонние библиотеки содержащие код сомнительного качества и пожирающие неизвестное количество памяти и также других ресурсов.
В теме можно найти и снобистские высказывания о том что парсить HTML regexp'ами это чуть ли не величайший грех. Вполне возможно, но только в идеальном мире.
В настоящее время пишу скрипт который собирает данные из HTML и сохраняет их в DB. Прислушался к совету снобов из предыдущей темы и решил воспользоваться этим: http://simplehtmldom.sourceforge.net/manual.htm
В итоге через некоторое время после запуска скрипта я получаю сообщение:
zend_mm_heap corrupted
В настоящее время занимаюсь тем что переписываю скрипт с regexp'ами. Потому что это проще чем объяснять заказчику дополнительные параметры конфигурации которые ещё невсегда помогают, потому что я потрачу меньше времени за те же деньги, потому что я практик а не сноб-теоретик, и потому что мне глубоко наплевать на ваш снобизм.
PS. Знаю что PHP унылое говно. Но такого ТЗ.