LINUX.ORG.RU

История изменений

Исправление DRVTiny, (текущая версия) :

Кстати, чтобы всем было понятно: я написал этот пост после прочтения http://gis-lab.info/qa/scrapy.html .

Огромное количество людей занимаются неблагодарным сизифовым трудом, пытаясь выловить из той семантической помойки, которую генерируют веб-приложения, что-то содержательное.

Я сам с этим сталкивался, когда составлял веб-тесты в том же Selenium'е: сегодня магическое сочетание div'ов и td вот такое, а завтра оно вообще было заменено на динамические вставки HTML'я обработчикам событий в JavaScript'е. Анализировать это, тестировать это и пытаться извлекать из этого структурированные данные - всё равно, что копаться в кучах говна.

Исходная версия DRVTiny, :

Кстати, чтобы всем было понятно: я написал этот пост после прочтения http://gis-lab.info/qa/scrapy.html .

То есть огромное количество людей, которые занимаются сизифовым трудом, пытаясь выловить из той семантической помойки, которую генерируют веб-приложения, что-то содержательное.

Я сам с этим сталкивался, когда составлял веб-тесты в том же Selenium'е: сегодня магическое сочетание div'ов и td вот такое, а завтра оно вообще было заменено на динамические вставки HTML'я обработчикам событий в JavaScript'е. Анализировать это, тестировать это и пытаться извлекать из этого структурированные данные - всё равно, что копаться в кучах говна.