[PostgreSQL] PostgreSQL 백업 방법 - SQL 덤프 백업

참고


개요

  • PostgreSQL 에서 제공하는 백업 방법에 대해서 조사 및 PoC 진행합니다.

PostgreSQL 백업 방법

  • PostgreSQL은 장애시 복구를 위해 3가지 백업방법이 있습니다.
  • 3가지 방법은 SQL 덤프 / 파일 시스템 기반 백업 / 아카이브 모드 백업입니다.
  • 이 중 SQL 덤프에 대해 다뤄보겠습니다.

SQL 덤프 백업 방법

  • 이 백업 방식은 pg_dump 명령어로 진행합니다.
  • pg_dump 를 실행하면 DB_NAME 데이터베이스에 생성된 객체와 데이터들을 SQL 구문 텍스트 형식으로 백업합니다.
  • 기본적으로 표준출력이기 떄문에 리다이렉션 기능을 사용하여 파일로 저장합니다.
$ pg_dump -U 소유주 DB명 > 백업파일명
  • 만약 소유주가 test, DB 명이 postgres 라면 다음과 같이 명령어를 작성하면 됩니다.
$ pg_dump -U test postgres > postgres_DB_NAME_bak.sql
  • 그럼 실제로 위와 같이 명령어를 작성 후, postgres_DB_NAME_bak.sql 백업 파일이 생성되는지 테스트 진행합니다.

  • 위와 같이 테스트 백업 파일이 생성된 것을 확인할 수 있습니다.

pg_dump 에서 제공하는 연결 옵션

  • 옵션을 보면 일반 클라이언트와 동일하게 원격으로 접속할 수 있는 옵션을 제공하고 있습니다.
  • 따라서 원격 데이터베이스에 접속 및 백업할 수 있는 권한이 있다면 원격 서버의 DB를 백업 받을 수 있습니다.
$ pg_dump --help

Connection options:
  -d, --dbname=DBNAME      database to dump
  -h, --host=HOSTNAME      database server host or socket directory
  -p, --port=PORT          database server port number
  -U, --username=NAME      connect as specified database user
  -w, --no-password        never prompt for password
  -W, --password           force password prompt (should happen automatically)

pg_dump 백업의 장점

  • pg_dump 를 이용하면 SQL 형식으로 쿼리가 출력되기 때문에, 복원하려는 PostgreSQL 버전이 다르거나, 운영체제 비트가 달라도 적용이 가능합니다.
  • pg_dump는 실행되는 시점의 스냅샷 상태로 작업을 진행합니다.
  • 이때 배타적 잠금이 발생하지 않는 상태라면, 대부분 작업은 정상적으로 수행됩니다.

pg_dump 백업의 단점

  • 서버가 실행되지 않는 상태에서 명령어 사용이 불가능 합니다.
  • 증분 데이터를 반영할 수 없다는 문제가 있습니다.

pg_dump 주의점

  • 만약 기존에 OID(Object Identifier Types) 값을 사용자 입장에서 사용하는 곳이 있다면, pg_dump 시 -o 옵션을 붙여서 복원할 때도 동일한 값으로 되도록 해야 합니다.
  • 만약 -o 옵션이 부여되지 않고 백업받은 경우 복원 시 OID 값이 변경될 수 있습니다.
  • 데이터를 포함한 모든 내용을 쿼리로 출력하기 때문에 리다이렉션되는 파일의 크기가 매우 커질 수 있습니다.
  • 최대 파일 크기가 제한된 운영체제도 있어, 이 크기를 초과하는 경우에 문제가 될 수 있으며 이런 경우 압축과 같은 기능을 이용하여 해결할 수 있습니다.
# 백업 시
$ pg_dump DB_NAME | gzip > postgres_DB_NAME_bak.gz

# 복원 시
$ gunzip -c postgres_DB_NAME_bak.gz | psql DB_NAME

pg_dumpall 명령어

  • 그러나 이 pg_dump 는 데이터베이스 한 개에만 적용됩니다.
  • PostgreSQL에 구성된 모든 데이터베이스를 한 번에 덤프받고 싶은 경우 pg_dumpall 명령어를 사용합니다.
  • pg_dumpall 은 모든 데이터베이스를 백업받기 떄문에 DB_NAME 을 지정하지 않습니다.
$ pg_dumpall > postgres_ALL_DB_NAME_bak.sql

pg_dump 와 pg_dumpall 의 차이점

pg_dump pg_dumpall
적용 범위 지정한 데이터베이스 1개 PostgreSQL에 구성된 데이터베이스 전체
SQL 지원범위 롤 생성 스크립트 (x)
데이터베이스 생성 스크립트(X)
테이블/SP 생성 스크립트 (O)
권한부여 스크립트 (O)
적재 스크립트 (O)
롤 생성 스크립트 (O)
데이터베이스 생성 스크립트(O)
테이블/SP 생성 스크립트 (O)
권한부여 스크립트 (O)
적재 스크립트 (O)

SQL 덤프 복원방법

  • pg_dump 로 받은 백업파일을 SQL 형태로 되어 있기 때문에, 쿼리 Import 형식으로 바로 수행이 가능합니다.
  • 위에서 백업 받은 덤프 백업 파일을 DB_NAME 에 수행해 줍니다.
  • 참고로, SQL 덤프 백업에서는 데이터베이스와 사용자 생성 쿼리가 없기 떄문에, 복원한 데이터베이스와 사용자는 사전에 만들어 주어야 합니다.
  • 복원 : psql -U {소유주} {DB 명} < {백업파일명}
$ psql -U 소유주 DB_NAME < postgres_DB_NAME_bak.sql

  • 기본적으로는 작업 도중 오류가 발생해도 파일의 끝까지 진행됩니다.
  • 이런 기능을 원하지 않는 경우에는 ON_ERROR_STOP 옵션을 부여하여 실패한 이후 쿼리부터는 수행되지 않도록 합니다.
  • 그러나 실패 전까지의 쿼리는 데이터베이스에 적용됩니다.
  • 만약 이를 원치 않고 실패 시 모든 작업을 취소하고 싶은 경우 single-transaction 옵션을 사용하면 됩니다.
$ psql --set ON_ERROR_STOP=1 --single-transaction < postgres_DB_NAME_bak.sql

특정 테이블만 백업 및 복원 하는 방법

  • 앞서 소개한 방법은 데이터베이스 전체를 백업 및 복원하는 방법입니다.
  • 데이터베이스 전체가 아닌, 특정 테이블만 백업하는 방법도 존재합니다.
  • 백업 : pg_dump -U {소유주} {DB 명} -t {테이블명} > {백업파일명} 명령을 통해서 특정 테이블만 백업 할 수 있습니다.
$ pg_dump -U user postgres -t userTable > db_bak.sql

  • 복원 : psql -U {소유주} -f {백업 파일명}{DB 명} 명령을 통해서 특정 테이블만 복원할 수 있습니다.
$ psql -U user -f db_bak.sql postgres
728x90

이 글을 공유하기

댓글

Designed by JB FACTORY