История изменений
Исправление hobbit, (текущая версия) :
Башем можно, но больно. Я бы брал сразу Perl. И увы, похоже, придётся именно под этот кривой HTML и затачивать. Если вид и кривость HTML заранее известны, тогда можно обойтись малой кровью на регулярках. (Хотя это сильно флеймогонная тема.)
Или задача стоит парсить И нормальный HTML, И кривой (с разных сайтов)?
Исходная версия hobbit, :
Башем можно, но больно. Я бы брал сразу Perl. И увы, похоже, придётся именно под этот кривой HTML и затачивать. Если вид и кривость HTML заранее известны, тогда можно обойтись малой кровью на регулярках.
Или задача стоит парсить И нормальный HTML, И кривой (с разных сайтов)?