Привет, коллеги.
Имею следующую ситуацию. По непонятным пока причинам при попытке резервного копирования БД PostgreSQL инструментом Barman, возникает проблема (если сделать чек конфигурации):
WAL archive: FAILED (please make sure WAL shipping is setup)
Данная ситуация, как известно, решается (точнее, должна решаться) выполнением:
barman switch-xlog --force --archive <server_name>
но по каким-то причинам на некоторых серверах лог переключается и всё в норме, а на некоторых переключения не происходит, Barman говорит что-то типа:
The WAL file 000000010000001400000067 has been closed on server 'server-name'
Waiting for the WAL file 000000010000001400000067 from server 'server-name' (max: 30 seconds)
ERROR: The WAL file 000000010000001400000067 has not been received in 30 seconds
Увеличение таймаута не помогает. Логи ничего не говорят (за исключением ситуаций, когда, например, проблема с аутентификацией в pg_hba). Если выполнить проверку конфигурации barman check для сервера, то все пункты будут ОК, кроме указанного выше. На нескольких серверах конфиг для barman одинаковый, но где-то есть проблема, где-то нет.
Из-за чего может происходить данная ситуация, чего может не хватать? Хотелось бы понимать, выполнение каких условий необходимо для однозначного успешного выполнения
barman switch-xlog --force --archive <server_name>