Посоветуйте плз что почитать на тему парсинга страниц, когда информация ищется на основе нечетких правил(не знаю блин, как это сформулировать). Предположим, мне нужно искать состав продуктов на разных сайтах, блоки в хтмл могут называться по разному(т.е. тут обращением к элементу дома не отделаешься), собственно говоря, как такаое делают?
Помню тут парень один нечто подобное писал - поделись опытом)