LINUX.ORG.RU

История изменений

Исправление praseodim, (текущая версия) :

Поэтому и считаю, что в массе это защита не от тех, кто стянуть у тебя пытается, а от тех, кто не даёт тебе лишнего про себя узнать.

Хз конечно, но все-таки, с точки зрения защиты от ботов написать бота, поддерживающего все трекеры и фингерпринты, достаточно сложно. По моему небольшому опыту скрейпинга самое простое - это подсмотреть в консоли браузера какие запросы и ответы отсылаются для нужных данных и потом вызывать их через curl и/или wget. Любое усложнение, даже просто необходимость принимать и отсылать сеансовые куки уже неприятна. Если честно, чем-то продвинутее куков я даже не занимался, скрейпил для себя и на нужных мне сайтах обычно хватало и простых вариантов.

С другой стороны, если компания продает профили пользователей для тагетированной рекламы или для каких-то оптимизаций своей работы, ей в самом деле явно не могут нравиться попытки помешать сборам таких данных и тем более подстановки фейковых.

Исправление praseodim, :

Поэтому и считаю, что в массе это защита не от тех, кто стянуть у тебя пытается, а от тех, кто не даёт тебе лишнего про себя узнать.

Хз конечно, но все-таки, с точки зрения защиты от ботов написать бота, поддерживающего все трекеры и фингерпринты, достаточно сложно. По моему небольшому опыту скрейпинга самое простое - это подсмотреть в консоли браузера какие запросы и ответы отсылаются для нужных данных и потом вызывать их через curl и/или wget. Любое усложнение, даже просто необходимость принимать и отсылать сеансовые куки уже неприятна. Если честно, я этим даже не занимался, скрейпил для себя и на нужных мне сайтах обычно хватало и простых вариантов.

С другой стороны, если компания продает профили пользователей для тагетированной рекламы или для каких-то оптимизаций своей работы, ей в самом деле явно не могут нравиться попытки помешать сборам таких данных и тем более подстановки фейковых.

Исходная версия praseodim, :

Поэтому и считаю, что в массе это защита не от тех, кто стянуть у тебя пытается, а от тех, кто не даёт тебе лишнего про себя узнать.

Хз конечно, но все-таки, с точки зрения защиты от ботов написать бота, поддерживающего все трекеры и фингерпринты, достаточно сложно. По моему небольшому опыту скрейпинга самое простое - это подсмотреть в консоли браузера какие запросы и ответы отсылаются для нужных данных и потом вызывать их через curl и/или wget. Любое усложнение, даже просто необходимость принимать и отсылать сеансовые куки уже неприятна.

С другой стороны, если компания продает профили пользователей для тагетированной рекламы или для каких-то оптимизаций своей работы, ей в самом деле явно не могут нравиться попытки помешать сборам таких данных и тем более подстановки фейковых.