LINUX.ORG.RU
ФорумTalks

[вброс][корпорация добра]Google Chrome отправляет контент страниц в индекс?

 ,


0

1
Я обещал рассказать историю о запрете Google Chrome в нашей организации еще в треде про SMS - выполняю обещание.

Итак, жил-был сайт. Часть его страниц была закрытой админской зоной. Причем закрыта была не в robots.txt (а зачем?), а на уровне доступа "white list" - то есть зайти туда можно было только с офисных IP самой компании.

И как же было удивительно видеть часть этих страниц в выдаче Гугла, причем, (вот это уже За Гранью Добра) не только страниц, но и сниппетов и сохраненной копии.

В общем расследование показало:
- Робот Гугла, естественно, туда зайти не мог - получал 500-ю ошибку.
- Но - была куча заходов с реферером от офисного Google Chrome, причем даже от тех людей, вход которых не был предусмотрен служебными обязанностями.
- Анализ трафика показывает, что Хром не просто отправляет URL посещенных пользователем страниц, но и их содержимое (!). Вот откуда и сниппеты, и сохраненная копия.

Как результат:
- Ну в общем я понимаю, что персональные данные всем безразличны, но тут уже речь идет о корпоративной информации в публичном доступе. Неужели и ей готовы делиться с Империей Добра?
- Google Chrome в нашей организации объявлен Spyware и запрещен.

Первая мысль естественно была пойти в суд, но увы - я не в России, и у нас нет такого вкусного закона о персональной информации. Но мы размышляем над этим.

PS: Нотариально Заверенные Скриншоты и логи естественно есть, в паблик не могу выложить -  не хочу светить компанию. Но Юре покажу по его просьбе.
PPS: Кстати, и robots.txt Гугль не соблюдает - прямо закрытые им страницы все равно будут в выдаче как найденные (по ссылке? Нет таких ссылок!), но уже без сниппета и сохраненной копии (и на том спасибо!) Примеры опять же есть.

-----------
Комментарий Roem.ru: всё-таки вспомним случай с вики "Яндекса" - закрытый раздел оказался публичным и попал в кэш и снипеты Google. Не могло ли быть такого?

И, пожалуйста, покажите скриншоты-логи на sinodov@roem.ru, я хотя бы в комментариях подтвержу, что что-то странное происходило.
Автор мне показал. Признавая справедливость множества вышенаписанных доводов, нельзя не сказать, что и его история с конкретными примерами выглядит впечатляюще (разумеется, он и сам признает, что доказать, что каталоги какое-то время не были открыты - невозможно) 

Ссылки на страницы из каталога закрытого для индексирования - тоже понравились 

Остальное автор расскажет сам, если захочет.

http://roem.ru/2011/07/29/addednews32694/



Последнее исправление: Panic_At_The_Kernel (всего исправлений: 1)

Мутное враньё. Уже сто раз проверили люди. Можете сами проверить же в любой момент. Кому выгодно так валить гугол?

wbrer ★★★
()
Ответ на: комментарий от wxw

>тем более, если отправлять не все страницы подряд, а только самые интересные

например те что гугл не может проиндексировать извне

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от question4

> Но ничто не мешало этим админам создать тысячу новых локальных страниц большого объёма, позаходить на них все Хромом с локальной машины, а затем посмотреть трафик с этой машины за пределы локальной сети.

Проще добавить гуглохром в черный список и не парить себе голову. И это правильно.

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от DNA_Seq

>Таких страниц полно в ЖЖ и КПД даже побольше будет

От этого Хабра автоматически становиться недостойным ресурсом? Или на хабре есть пиар и прочее говно, а на ЖЖ все чинно мирно?

xscrew ★★
()
Ответ на: комментарий от stevejobs

>сама обновляла страницы раз в пару минут
Вообще-то «Reload every ***» в опере включается через контекстное меню для конкретного таба и по дефолту это выключено.

Ramen ★★★★
()
Ответ на: комментарий от DNA_Seq

>хабр это ресурс ходить на который стоит только из поисковика и в ридонли

Кому и как куда ходить - личное дело каждого.

xscrew ★★
()

очень тухлый вброс, раньше лучше было, оче тухло

po1s0n
()
Ответ на: комментарий от DNA_Seq

> Проще добавить гуглохром в черный список и не парить себе голову. И это правильно.

Нет, неправильно. Если можно доказать вину гуглохрома — тогда достаточно его запретить и успокоиться. Если доказать нельзя, то они просто обязаны проверить все остальные возможности. У меня возникло впечатление, что они нашли дыру в своём сервере (вроде упомянутой отдачи страницы по 500), заткнули её, а теперь собирают аналогичные «доказательства», чтобы предъявить их начальству. Если начальство в этом не разбирается, а некомпетентные админы массово начнут пугать друг друга хромом — прокатит.

question4 ★★★★★
()
Ответ на: комментарий от question4

>Если доказать нельзя, то они просто обязаны проверить все остальные возможности

С чего это? Не официальное же обвинение выдвигается. Вот если судится с гуглом то да, надо все проверить. Однако об иске ни слова.

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от DNA_Seq

>С чего это? Не официальное же обвинение выдвигается.

Ну и так понятно, что это просто бабалобольство.

xscrew ★★
()
Ответ на: комментарий от DNA_Seq

>> Если доказать нельзя, то они просто обязаны проверить все остальные возможности

С чего это? Не официальное же обвинение выдвигается.

Они обязаны обеспечить сокрытие этой информации от посторонних. Если не могут, значит не соответствуют занимаемым должностям и наносят ущерб фирме :)

Если виноват Хром, то да, всё просто. Запретить Хром и не париться.

Если виноват неправильно настроенный сервер, то тоже всё просто. Правильно настроить сервер и попросить Гугл убрать их страницы. Чтобы начальство не заподозрило админов в некомпетентности, свалить всё на Хром и запретить его.

А если есть только подозрения к хрому, тогда плохо. Пока эти подозрения основаны лишь на (вполне объяснимой) неприязни к Гуглу. Если запрет Хрома не поможет и конфиденциальные документы будут и дальше появляться в кеше Гугла, админам придётся хреново :)

question4 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.