Странности с восстановлением PostgreSQL из бекапа

pgbackrest, postgresql, repmgr

0

3

Есть кластер PostgreSQL 15. ОС хоста Rocky 8. Конфигурация кластера: master + реплика. Репликацию настраивал через repmgr. В кластере настроены бекапы с помощью PgBackRest на внешнее S3 хранилище. WAL льется с мастера, файлы данных — с реплики. Все как здесь написано: https://habr.com/ru/articles/518232/.

Если грохнуть базу и восстановить последнее состояние с помощью sudo -u postgres pgbackrest --stanza=cluster restore, то всё отрабатывает как положено.

Хочу протестировать кейс с Point in Time Recovery.

Создаю базу данных.
Наполняю её тестовыми данными.
Делаю полный бекап sudo -u postgres pgbackrest --stanza=cluster --log-level-console=info --type=full backup. Запоминаю время окончания бекапа.
Дропаю таблицу. PostgreSQL делает чекпоинт и отправляет WAL в S3. Хочу восстановиться на момент, когда таблица не была удалена (т.е. WAL, который после бекапа из п.3 восстанавливать не надо).
Останавливаю master и replica systemctl stop postgresql-15.
Удаляю все файлы с master и replica sudo -u postgres find /var/lib/pgsql/15/data -mindepth 1 -delete.
Смотрю в какое время завершился бекап с помощью sudo -u postgres pgbackrest --stanza=cluster info.
Запускаю команду вида sudo -u postgres pgbackrest --stanza=cluster --type=time --target="время-завершения-бекапа" restore.
Запускаю master.
Вижу, что master находится в recovery, поэтому выполняю на select pg_wal_replay_resume();.
С помощью repmgr standby clone наливаю реплику.
Запускаю реплику и повторно регистрирую ее в master: repmgr standby register -F.

Вижу предупреждение вида

WARNING: following issues were detected
  - WAL replay is paused on node "192.168.1.126" (ID: 2) with WAL replay pending; this node cannot be manually promoted until WAL replay is resumed

Вопросы:

Что я делаю не так?
Как поднять реплику после восстановления из бекапа?

Ссылка

validate restore > /dev/null делаете?
* это не реальная команда рестора
просто гдето в стримах дата егрет/пгпро слышал что полезно прогонять тестовые ресторы в /dev/null для поиска hidden error в бинарных бекапах.
** это a-like wal-g/pg_basebackup[[-]pro(?)]

etwrq ★★★★★
(27.12.23 22:58:05 MSK)
Последнее исправление: etwrq 27.12.23 23:01:10 MSK (всего исправлений: 1)

Ответ на: комментарий от etwrq 27.12.23 22:58:05 MSK

Проверку делаю, да, все проходит успешно:

2023-12-28 16:09:14.831 P00   INFO: verify command end: completed successfully (9263ms)

Goganchic ★★
(28.12.23 16:09:51 MSK) автор топика

Похожие темы