В общем так, немножко предыстории.
Стояла у меня на школоло-сервере 11.4, крутилось на ней: самба, ежабберд, привокси, сквид, нфс... ну и так, по мелочи. И проблем с этим самым нфс не было. В смысле - СОВСЕМ НЕ БЫЛО.
Но вот срок поддержки 11.4 вроде как закончился, ага. И решил я кардинально обновиццо. Сразу на 12.2. Конфиги забэкапил на другую машину, и установил на этот самый «сервачок» новый дистр. И всё, заверьте...
Теперь по сабжу.
Буквально сразу же начались траблы, и если со всякими невидиями и прочими устройствами оно было ожидаемо, то вот падение нфс было равносильно снегопаду в середине июля.
Суть такова, нфс ВНЕЗАПНО какбэ падает. Почему какбэ? Потому что возможны два варианта.
1. При запросе статуса сервиса нфс выводится, что нфс failed, но всё работает.
2. Внезапно при загрузке/сохранении файлов в нфс-шару всё намертво виснет, по запросу статуса выдаёт фейл, как в п.1
Немножко выхлопа из мессаджесов:
Dec 12 09:19:41 zg153 kernel: [67601.512911] statd: server rpc.statd not responding, timed out
Dec 12 09:19:41 zg153 kernel: [67601.512959] lockd: cannot monitor L9
Dec 12 09:20:16 zg153 kernel: [67636.584149] statd: server rpc.statd not responding, timed out
Dec 12 09:20:16 zg153 kernel: [67636.584193] lockd: cannot monitor z5
Dec 12 09:20:51 zg153 kernel: [67671.655296] statd: server rpc.statd not responding, timed out
Dec 12 09:20:51 zg153 kernel: [67671.655330] lockd: cannot monitor z8
Dec 12 09:21:26 zg153 kernel: [67706.726560] statd: server rpc.statd not responding, timed out
Dec 12 09:21:26 zg153 kernel: [67706.726595] lockd: cannot monitor L9
Dec 12 09:22:01 zg153 kernel: [67741.797742] statd: server rpc.statd not responding, timed out
Dec 12 09:22:01 zg153 kernel: [67741.797793] lockd: cannot monitor z5
Dec 12 09:22:36 zg153 kernel: [67776.868989] statd: server rpc.statd not responding, timed out
Dec 12 09:22:36 zg153 kernel: [67776.869023] lockd: cannot monitor z8
Dec 12 09:23:11 zg153 kernel: [67811.940167] statd: server rpc.statd not responding, timed out
Dec 12 09:23:11 zg153 kernel: [67811.940205] lockd: cannot monitor L9
Dec 12 09:23:46 zg153 kernel: [67847.011349] statd: server rpc.statd not responding, timed out
Dec 12 09:23:46 zg153 kernel: [67847.011384] lockd: cannot monitor z5
Dec 12 09:24:07 zg153 rpc.statd[2099]: process_notify_list: Can't callback zg153 (100021,3), giving up
Dec 12 09:24:21 zg153 kernel: [67882.082597] statd: server rpc.statd not responding, timed out
Dec 12 09:24:21 zg153 kernel: [67882.082637] lockd: cannot monitor z8
Dec 12 09:24:56 zg153 kernel: [67917.153793] statd: server rpc.statd not responding, timed out
Dec 12 09:24:56 zg153 kernel: [67917.153829] lockd: cannot monitor L9
Dec 12 09:25:31 zg153 kernel: [67952.225010] statd: server rpc.statd not responding, timed out
Dec 12 09:25:31 zg153 kernel: [67952.225047] lockd: cannot monitor z5
Dec 12 09:26:06 zg153 kernel: [67987.296208] statd: server rpc.statd not responding, timed out
Dec 12 09:26:06 zg153 kernel: [67987.296244] lockd: cannot monitor sz0
Dec 12 09:26:42 zg153 kernel: [68022.367407] statd: server rpc.statd not responding, timed out
Dec 12 09:26:42 zg153 kernel: [68022.367452] lockd: cannot monitor z8
Dec 12 09:27:17 zg153 kernel: [68057.438629] statd: server rpc.statd not responding, timed out
Dec 12 09:27:17 zg153 kernel: [68057.438659] lockd: cannot monitor L9
Dec 12 09:27:52 zg153 kernel: [68092.509822] statd: server rpc.statd not responding, timed out
Dec 12 09:27:52 zg153 kernel: [68092.509856] lockd: cannot monitor z5
Dec 12 09:28:27 zg153 kernel: [68127.581084] statd: server rpc.statd not responding, timed out
Dec 12 09:28:27 zg153 kernel: [68127.581121] lockd: cannot monitor sz0
Dec 12 09:29:02 zg153 kernel: [68162.652269] statd: server rpc.statd not responding, timed out
Dec 12 09:29:02 zg153 kernel: [68162.652305] lockd: cannot monitor z8
Dec 12 09:29:36 zg153 sm-notify[10677]: Version 1.2.6 starting
Dec 12 09:29:36 zg153 sm-notify[10677]: Already notifying clients; Exiting!
Dec 12 09:29:36 zg153 nfs[10666]: Starting NFS client services: sm-notify idmapd..done
Dec 12 09:29:36 zg153 nfs[10682]: Shutting down NFS client services:umount: /var/lib/nfs/rpc_pipefs: target is busy.
Dec 12 09:29:36 zg153 nfs[10682]: (In some cases useful info about processes that use
Dec 12 09:29:36 zg153 nfs[10682]: the device is found by lsof(8) or fuser(1))
Dec 12 09:29:36 zg153 nfs[10682]: ..failed
Dec 12 09:29:36 zg153 systemd[1]: nfs.service: control process exited, code=exited status=1
Dec 12 09:29:36 zg153 systemd[1]: Unit nfs.service entered failed state.
Dec 12 09:30:12 zg153 kernel: [68232.794683] statd: server rpc.statd not responding, timed out
Dec 12 09:30:12 zg153 kernel: [68232.794716] lockd: cannot monitor z5
Свежачокс, так сказать. Дети открывали свои документы из нфс-шары. 10 клиентов. Каждый запускал свой документ. Всё вывесилось, рестарт службы не дал результатов, как вы видите.
Кстати, странный каталог
/var/lib/nfs/rpc_pipefs, который обычно занят. Не удаляеццо, кстати.
Далее, ребучу сервер. В мессаджесах насторожило вот это:
Dec 12 09:31:40 zg153 network-remotefs[1625]: Setting up (remotefs) network interfaces:
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to open /var/lib/nfs/sm/192.168.0.57: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.53: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.51: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.54: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.55: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.59: No such file or directory
Dec 12 09:31:40 zg153 rpc.statd[1922]: Failed to stat /var/lib/nfs/sm/192.168.0.58: No such file or directory
Dec 12 09:31:40 zg153 kernel: [ 26.316307] NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
Dec 12 09:31:40 zg153 kernel: [ 26.328050] NFSD: starting 90-second grace period
Dec 12 09:31:40 zg153 sm-notify[2013]: Version 1.2.6 starting
Dec 12 09:31:40 zg153 sm-notify[2013]: Already notifying clients; Exiting!
Такие вот дела, я вообще не понял, чего ему надо. И куда копать?
Если ещё какой выхлоп надо, то пишите - закину.