LINUX.ORG.RU

История изменений

Исправление hobbit, (текущая версия) :

Башем можно, но больно. Я бы брал сразу Perl. И увы, похоже, придётся именно под этот кривой HTML и затачивать. Если вид и кривость HTML заранее известны, тогда можно обойтись малой кровью на регулярках. (Хотя это сильно флеймогонная тема.)

Или задача стоит парсить И нормальный HTML, И кривой (с разных сайтов)?

Исходная версия hobbit, :

Башем можно, но больно. Я бы брал сразу Perl. И увы, похоже, придётся именно под этот кривой HTML и затачивать. Если вид и кривость HTML заранее известны, тогда можно обойтись малой кровью на регулярках.

Или задача стоит парсить И нормальный HTML, И кривой (с разных сайтов)?