С 3 по 5 февраля в Москве на площадке Известия Холл проходила конференция PGConf 2016.
Были различные доклады и мастер-классы, однако я хочу отметить один доклад который мне особенно понравился про резервное копирование.
Автор доклада Michael Paquier рассказал про свою разработку менеджера резервного копирования кластера PostgreSQL.
Попробую кратко описать суть, как её понял я:
Сначала делается полная резервная копия файлов кластера как это делается обычно pg_start_backup && tar -zcf /path/to/backup.tar.gz $PGDATA && pg_stop_backup. При этом, запоминается номер транзакции или другая отметка этого момента.
Затем при повтором запуске оно делает не полную копию как в первый раз, а с момента отметки прошлой вычитывает номера страничек из WAL которые были изменены и копирует только их.
Все это обернуто в довольно удобную утилитку pg_arman для сохранения и восстановления. Автор выкладывает все в GitHub. Для боевого использования оно пока не годится, зато потестировать можно.