Время от времени bind перестаёт резолвить некий произвольный домен. Вернее догадываюсь что их может быть много, но замечается один. Если не заметить (мониторинг проверяет ya.ru) то в течении 10 минут восстанавливается. Если просто перечитать конфиг: systemctl reload named то этого оказывается достаточно чтобы исправить.
Вот как это показывает dig:
$ dig @10.1.1.40 open.ru
; <<>> DiG 9.10.8-P1 <<>> @10.1.1.40 open.ru
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: SERVFAIL, id: 37756
;; flags: qr rd ra; QUERY: 1, ANSWER: 0, AUTHORITY: 0, ADDITIONAL: 1
;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4096
;; QUESTION SECTION:
;open.ru. IN A
;; Query time: 36 msec
;; SERVER: 10.1.1.40#53(10.1.1.40)
;; WHEN: Wed Apr 15 13:22:13 +04 2020
;; MSG SIZE rcvd: 36
$
При этом если сделать +trace то результат правильный.
Как можно такое попытаться диагностировать? В логах вроде всё как обычно.