История изменений
Исправление comp00, (текущая версия) :
бизун, ты че, вышку так и не окончил, да?
Идея вообще норм, но проектирование....
Очень простой способ
Парсинг контента - очень простой способ ? Чтолол? Оказоустойчивость - нулевая, эффективность - нулевая, сложность поддержки - максимальная, вероятность получить в табло реакцию от авторов ресурсов - максимальная. Ты хоть сам процесс понимаешь? Ты понимаешь, сколько в среднем надо запросов к одному ресурсу для снятия среза всего его контента? С учетом категорий, пагинации? Ты понимаешь, что нормальный магазин твой IP через неделю в блеклист занесет и весь твой парсинг уйдет в жопу? Если нет - то забей, веб, да и вообще программирование не для тебя (кажется, я тебе это года 2 назад еще говорил).
Ну ок, допустим ты совсем неочень и ничего этого не понимаешь. Хранить срез в БД ? А как гарантировать актуальность? Запуск раз в сутки UPDATE не гарантирует актуальность информации в твоем локалсторе, не говоря уже о том, что это повесит твою впску, или что там за ведро у тебя, при первой же итерации.
В общем, есть такая штука, JSON API называется. Если магаз хочет, что бы его контент использовали - он, этот API, запиоливает. Если нет - на нет и суда нет. Те магазины, где ты не смог подцепить данные по JSON/XML в любом случае не будут счастливы, узнав что ты парсишь их контент, даже если сие действие их рекламирует. Только тут такой момент: что рекалама, а что нет? Существует очень высокая, практически 100% вероятность того, что твоя реклама станет антирекламой, на определенном наборе.
Исходная версия comp00, :
бизун, ты че, вышку так и не окончил, да?
Идея вообще норм, но проектирование....
Очень простой способ
Парсинг контента - очень простой способ ? Чтолол? Оказоустойчивость - нулевая, эффективность - нулевая, сложность поддержки - максимальная, вероятность получить в табло реакцию от авторов ресурсов - максимальная. Ты хоть сам процесс понимаешь? Ты понимаешь, сколько в среднем надо запросов к одному ресурсу для снятия среза всего его контента? С учетом категорий, пагинации? Ты понимаешь, что нормальный магазин твой IP через неделю в блеклист занесет и весь твой парсинг уйдет в жопу? Если нет - то забей, веб, да и вообще программирование не для тебя (кажется, я тебе это года 2 назад еще говорил).
Ну ок, допустим ты совсем неочень и ничего этого не понимаешь. Хранить срез в БД ? А как гарантировать актуальность? Запуск раз в сутки UPDATE не гарантирует актуальность информации в твоем локалсторе, не говоря уже о том, что это повесит твою впску, или что там за ведро у тебя, при первой же итерации.
В общем, есть такая штка, JSON API называется. Если магаз хочет, что бы его контент использовали - он, этот API, запиоливает. Если нет - на нет и суда нет. Те магазины, где ты не смог подцепить данные по JSON/XML в любом случае не будут счастливы, узнав что ты парсишь их контент, даже если сие действие их рекламирует. Только тут такой момент: что рекалама, а что нет? Существует очень высокая, практически 100% вероятность того, что твоя реклама станет антирекламой, на определенном наборе.