LINUX.ORG.RU
ФорумAdmin

Powerdns сервер работает с перебоями. Нужен совет

 ,


0

1

Добрый день!

Настроил pdns-server + pdns-recursor на шлюзе.

Запросы на 95% рекурсивные к .root-servers.net

Нагрузка на железо минимальна.

15:55:26 up 23 min, 2 users, load average: 0,22, 0,26, 0,24

Оперативки занято 63МB

Смотрю статистику dns сервера.

PDNS 3.1 Main Page

Uptime: 11 minutes Queries/second, 1, 5, 10 minute averages: 9.09, 9.04, 6.85. Max queries/second: 13.6 Cache hitrate, 1, 5, 10 minute averages: 31.1%, 43.6%, 46.4% Backend query cache hitrate, 1, 5, 10 minute averages: 71.7%, 71.3%, 71.3% Backend query load, 1, 5, 10 minute averages: 10.6, 8.86, 6.31. Max queries/second: 13.5 Total queries: 6887. Question/answer latency: 0ms

Подробная статистика http://pastebin.com/H9iayxwG

Но powerdns с нагрузкой не справляется - большинство запросов остаются без ответа. Как 13 запросов в секунду могут завалить новый мощный сервер?

У меня подозрение, что кто-то в локальной сети качает torrent, и так сильно забивает канал, что его ширины даже на dns запросы от сервера уже не хватает.

Прошу помочь в решении проблемы.



Последнее исправление: juffinhalli (всего исправлений: 1)

Что означает «большинство запросов остаются без ответа»? Поясните схему, зачем в ней pdns-server и зачем pdns-recursor. Кто к ним делает запросы, приведите пример с выводом, например, с помощью команды dig - где видно, что в действительности вам приходит в ответ - таймаут или servfail или что-то еще.

Судя по приведенной вами статистике - все запросы, дошедшие до резолвера, были успешно зарезолвлены. Если проблема действительно имеет место быть - она где-то между клиентом и шлюзом, где живет pdns. Попробуйте локально на шлюзе что либо отрезолвить через pdns-recursor. Например, с помощью того же dig.

over_quota
()
Ответ на: комментарий от over_quota

«большинство запросов остаются без ответа» означает что юзеру, чтобы открыть страницу в бразере, приходится раз так 10 нажать F5. Схема? Есть шлюз с двумя сетевыми картами (провайдер + локалка). У всех клиентских компов шлюзом и dns приписана эта машина с Debian. C помощью iptables masq он раздаёт интернет-трафик в локальную сеть. На нём же работает pdns-сервер, чтобы юзеры могли обращаться на локальный сервер по имени webserver.corp. На нём же работает кеширующий pdns-recursor чтобы юзеры могли ресолвить интернет-адреса типа yandex.ru

Точно такая же проблема была и с dnsmasq, часть запросов терялась Например так: ssh: Could not resolve hostname webserver.corp: Name or service not known

К сожалению проблема плавающая и проблемый выхлоп dig сейчас выложить не могу.

juffinhalli
() автор топика
Ответ на: комментарий от juffinhalli

Пологгировать что покажет bwm-ng/iptraf'ом - посмотреть, есть ли полка? iftop - посмотреть, может кто-то уже выедает сеть?

tcpdump -tttt -i <LOCAL_NET_INTERFACE> -A -s 0 -n udp port 53 --- посмотреть на шлюзе, что там из dns запросов по udp долетает от клиентов и что улетает им во время проявления проблемы? Если добавите сюда '-w <PATH_TO_LOG>' - можете пологгировать также на шлюзе, что от клиентов прилетело и что улетело

Собственно по логам можно вообще построить простенькие графики и пыриться в них :) А по логу bwm-ng - топ качающих пользователей

ну это что первое в голову приходит

over_quota
()
Ответ на: комментарий от over_quota

Настроил логи - нашёл много timeout до любых dns-серверов. Буду мучить провайдера

juffinhalli
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.