История изменений
Исправление DRVTiny, (текущая версия) :
Кстати, чтобы всем было понятно: я написал этот пост после прочтения http://gis-lab.info/qa/scrapy.html .
Огромное количество людей занимаются неблагодарным сизифовым трудом, пытаясь выловить из той семантической помойки, которую генерируют веб-приложения, что-то содержательное.
Я сам с этим сталкивался, когда составлял веб-тесты в том же Selenium'е: сегодня магическое сочетание div'ов и td вот такое, а завтра оно вообще было заменено на динамические вставки HTML'я обработчикам событий в JavaScript'е. Анализировать это, тестировать это и пытаться извлекать из этого структурированные данные - всё равно, что копаться в кучах говна.
Исходная версия DRVTiny, :
Кстати, чтобы всем было понятно: я написал этот пост после прочтения http://gis-lab.info/qa/scrapy.html .
То есть огромное количество людей, которые занимаются сизифовым трудом, пытаясь выловить из той семантической помойки, которую генерируют веб-приложения, что-то содержательное.
Я сам с этим сталкивался, когда составлял веб-тесты в том же Selenium'е: сегодня магическое сочетание div'ов и td вот такое, а завтра оно вообще было заменено на динамические вставки HTML'я обработчикам событий в JavaScript'е. Анализировать это, тестировать это и пытаться извлекать из этого структурированные данные - всё равно, что копаться в кучах говна.