LINUX.ORG.RU

История изменений

Исправление shahid, (текущая версия) :

В помощью scraper'ам есть ещё RDF внутри обычных HTML-страниц, который осилили некоторые сайты, чтобы агрегаторы (в т.ч. яндекс) цепляли это. Например, театры продающие билеты на перфомансы.

И что оказывается в народе это чем-то нехорошим, вроде спама

Понятное дело, что илитка пишет свой SAX-парсер с экстракторами данных для каждого сайта без API.

Исходная версия shahid, :

В помощью scraper'ам есть ещё RDF внутри обычных HTML-страниц, который осилили некоторые сайты. Например, театры продающие билеты на перфомансы.

И что оказывается в народе это чем-то нехорошим, вроде спама

Понятное дело, что илитка пишет свой SAX-парсер с экстракторами данных для каждого сайта без API.