История изменений
Исправление shahid, (текущая версия) :
В помощью scraper'ам есть ещё RDF внутри обычных HTML-страниц, который осилили некоторые сайты, чтобы агрегаторы (в т.ч. яндекс) цепляли это. Например, театры продающие билеты на перфомансы.
И что оказывается в народе это чем-то нехорошим, вроде спама
Понятное дело, что илитка пишет свой SAX-парсер с экстракторами данных для каждого сайта без API.
Исходная версия shahid, :
В помощью scraper'ам есть ещё RDF внутри обычных HTML-страниц, который осилили некоторые сайты. Например, театры продающие билеты на перфомансы.
И что оказывается в народе это чем-то нехорошим, вроде спама
Понятное дело, что илитка пишет свой SAX-парсер с экстракторами данных для каждого сайта без API.