LINUX.ORG.RU
ФорумTalks

Вангую про спутник


0

2

Завел отдельную тему, чтобы можно было потом быстро сослаться на свою правоту или ошибку.

Так вот, ожидаю, что он будет применять агрессивные методы поиска по сайтам, включая, скорее всего, игнорирование robots.txt и попытки маскироваться под пользовательский браузер.

Интересно, угадаю или нет?

★★★★★

Да вроде нет, SputnikBot успешно банится через robots.txt. Вот только берут сомнения, надо ли это делать...

lampslave ★★
()
Ответ на: комментарий от goingUp

Чтоб знать то, что скрывают от поисковиков. Да я в курсе, что чаще всего цель исключений в robots.txt чисто техническая. Но например, некоторые электронные библиотеки специально принимают меры, чтобы их не индексировали в поисковиках.

praseodim ★★★★★
() автор топика
Ответ на: комментарий от praseodim

Зачем это общедоступному поиску? лично для себя фсб может отдельный сервак намутить под такую тему

Satou ★★★★
()
Ответ на: комментарий от Satou

Ну если ошибся с прогнозом, даже рад буду, значит уровень маразма, все-таки не настолько высокий.

praseodim ★★★★★
() автор топика

Россия + спутник = не взлетит.

najlus ★★★★★
()

А мне стало пофиг на «агрессивные методы» как поставил ваниш. Да и в бинг залез и спутник уже всё проидексировал.

artb1sh
()

Ты на самом деле считаешь что тот же гугол не индексирует сайты, игнорируя robots.txt?
Идёт ли это в выдачу результатов поиска - совсем другой вопрос.

polym
()

Интересно, угадаю или нет?

Учитывая количество готовых опенсорсных кравлеров, работающих поверх hadoop, вообще не понимаю, зачем что-то гадать. Покурить матчасть, и ответ уже готов.

shahid ★★★★★
()

если хочешь точно скрыть содержимое от поисковика - грузи весь контент через ajax, а се данные о том, что показывать, передавай серверу не через адресную строку, а тоже через ajax.

тогда придется адаптировать индексатор к конкретному сайту.

cvs-255 ★★★★★
()
Ответ на: комментарий от cvs-255

грузи весь контент через ajax

Кто знает на что способны поисковики особого назначения. Для надёжности надо текст рендерить в картинки с шумом.

true_admin ★★★★★
()
Ответ на: комментарий от DeVliegendeHollander

Как проект назовёте, так он и не взлетит.

zorg ★★
()

sputnik.ru - TV

Очень понравилось наличие ТВ на главной. Можно будет бесплатно, без смс смотреть крупные спортивные мероприятия.

P.S. правда не совсем ясно, что у них с соблюдением прав на трансляцию.

Jurik_Phys ★★★★★
()
Последнее исправление: Jurik_Phys (всего исправлений: 1)
Ответ на: sputnik.ru - TV от Jurik_Phys

правда не совсем ясно, что у них с соблюдением прав на трансляцию

ростелеком же

TheAnonymous ★★★★★
()

желаю проекту сдохнуть забвении, а разоработчкам - в мучениях, от отравления дошираком.

bl ★★★
()

Все гораздо проще. Ничего полезного он находить не будет, деньги попилят.

Deleted
()
Ответ на: комментарий от bl

забыл наванговать дату. апрель следующего года.

bl ★★★
()
Ответ на: комментарий от Satou

Зачем это общедоступному поиску? лично для себя фсб может отдельный сервак намутить под такую тему

Зачем пилить 2, если всё можно реализовать в одном флаконе с разграничением выдачи результатов.

Umberto ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.