LINUX.ORG.RU

С какой скоростью можно дергать ЛОР? Или где-то уже лежит полный архив, хотя бы месячной давности?


0

0

Лучше всего был бы архивнутый дамп нескольких таблиц в SQL. А иначе -- только дергать... и перегружать сервер не хочется. В общем, сколько раз в сутки можно дергать по http тему целиком? (поиск по сайту, как тяжелую операцию, я делать не буду)

(зачем мне это надо? хочется побаловаться полуавтоматическим нахождением интересной инфы)

Кстати, Википедия регулярно делает и предоставляет дамп своей базы (за исключением паролей :-)

www_linux_org_ru ★★★★★
() автор топика

Популярные темы живут во внутреннем кеше сайта и их генерация почти не нагружает сервер. Старые темы нужно тянуть с некоторым ограничением по количеству запросов (скажем не чаще десяти запросов в минуту).

В любом случае робот должен тянуть контент в один поток. Заголовоку Last-Modified для топика можно верить, дата обновляется при любых операциях.

maxcom ★★★★★
()
Ответ на: комментарий от z0D5e8n7x

И все сразу подумали об одном и том же ? ;)

VIM
()
Ответ на: комментарий от anonymous

"njuj ytkmpz ltkfnm, поскольку тогда кто-нить организует ресурс, дублирующий ЛОР, но с адекватной модерацией и пользователи переползут туда..

anonymous
()
Ответ на: комментарий от anonymous

Сорри, переключалка тормозит..
"njuj ytkmpz ltkfnm = этого нельзя делать

anonymous
()
Ответ на: комментарий от anonymous

> не переползут. Паролей то нет.

Ну те, кого колбасит регаться - перезарегаются на новом ресурсе. И отвечать будут там. А здесь только ссылки на ответ давать типа ответил на это там-то - потому, что тут всё трут без разбору несколько неадекватных модераторов. Так все и переедут. По этому ни в коем случае нельзя давать свободный доступ к базе сообщений.

anonymous
()
Ответ на: комментарий от anonymous

> Тоже самое можно crawler'ом cделать, только геморроя больше.

Им "удалённые" из базы не вытащишь.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.