SlideShare uma empresa Scribd logo
Desmistificando Replicação no PostgreSQL
Euler Taveira
São Paulo, 06/05/2017
Sobre esta apresentação
• esta apresentação está disponível em:
http://www.timbira.com.br/material
• esta apresentação está sob licença Creative Commons
Atribuição-Não Comercial 3.0 Brasil:
http://creativecommons.org/licenses/by-nc/3.0/br
c b n
Apresentação
• Euler Taveira
• Desenvolvedor PostgreSQL
• Líder do PostgreSQL Brasil
• @eulerto
• http://eulerto.blogspot.com
• Timbira
• Diretor Técnico
• A empresa brasileira de PostgreSQL
• Consultoria
• Desenvolvimento
• Suporte 24x7
• Treinamento
Resumo
1 Introdução
2 Evolução
3 Ferramentas
4 Conclusão
Timbira - A empresa brasileira de PostgreSQL 1 / 54
O que é?
• perguntas mais frequentes
• curiosidades
• conceitos de bancos de dados
• como fazer
Timbira - A empresa brasileira de PostgreSQL 2 / 54
O que não é?
• tópicos avançados
• comparação com soluções de outros SGBDs
• soluções de replicação a nível de sistema de arquivos
• soluções de replicação a nível de hardware
Timbira - A empresa brasileira de PostgreSQL 3 / 54
Um pouco de teoria...
• ”Replicação significa que nós armazenamos várias cópias de
uma relação ou partições dela em sites diferentes.”
• Motivação:
• aumentar a disponibilidade
• problema na réplica
• falha de comunicação
• acelerar execução de uma consulta
• réplica mais próxima pode executar consulta mais rápido
• balancear a carga no SGBD
• tolerância a falhas (SPOF)
• Como manter a réplica quando a relação é modificada?
• síncrono
• assíncrono
Timbira - A empresa brasileira de PostgreSQL 4 / 54
Replicação Física: Hardware
nó A nó B
postgres off
Timbira - A empresa brasileira de PostgreSQL 5 / 54
Replicação Física: Sistema Operacional
nó A nó B
postgres off
Timbira - A empresa brasileira de PostgreSQL 6 / 54
Replicação Lógica
nó A nó B
Timbira - A empresa brasileira de PostgreSQL 7 / 54
Granularidade
• segmento de log de transação: quando um arquivo de log
de transação é arquivado, ele é aplicado no outro nó
• archive_timeout (longo)
• buffer de log de transação: quando a transação é efetivada,
ela é transmitida e efetivada no outro nó
• ≾ 1 seg (curto)
Streaming Replication
Warm Standby (< 9.0)
segmento #1 segmento #2
aplicar em caso de desastre
Timbira - A empresa brasileira de PostgreSQL 8 / 54
Uso do servidor réplica
• warm standby: o servidor réplica não aceita conexões
• hot standby: o servidor réplica aceita conexões
Hot Standby Warm Standby
principal
réplica
principal
réplica
Timbira - A empresa brasileira de PostgreSQL 9 / 54
Alta Disponibilidade
• manter o serviço disponível o máximo de tempo possível
• parada
• programada (manutenção)
• não programada (falha / desastre)
• Acordo de Nível de Serviço (SLA)
• porcentagem do uptime / tempo
• tempo médio para recuperação
• tempo médio entre falhas
Timbira - A empresa brasileira de PostgreSQL 10 / 54
Alta Disponibilidade
Disponibilidade Parada por ano Parada por mês
90% 36,5 dias 72 horas
99% 3,65 dias 7,2 horas
99,9% 8,76 horas 43,8 minutos
99,99% 52,56 minutos 4,32 minutos
99,999% 5,26 minutos 25,9 segundos
99,9999% 31,5 segundos 2,59 segundos
99,99999% 3,15 segundos 0,259 segundos
Timbira - A empresa brasileira de PostgreSQL 11 / 54
Failover
• transferência do serviço em caso de falha
• quando um servidor falha, outro servidor assume o seu serviço
réplica
principal
principal
antigo
DEPOISANTES
Timbira - A empresa brasileira de PostgreSQL 12 / 54
Failback
• retornar serviço ao servidor principal
• estado anterior a falha
principal
antigo
réplica
principal
ANTES DEPOIS
Timbira - A empresa brasileira de PostgreSQL 13 / 54
Cascateamento
• servidor A replica para servidor B e C
• servidor B replica para servidor D e E
servidor A
servidor C
servidor E
servidor B servidor D
Timbira - A empresa brasileira de PostgreSQL 14 / 54
Balanceamento de Carga
• distribuir a carga entre diversos servidores
• algoritmos de agendamento
• randômico
• round robin
• carga assimétrica
• otimizar a utilização de recursos
• maximizar o desempenho
• evitar sobrecarga
Timbira - A empresa brasileira de PostgreSQL 15 / 54
Resumo
1 Introdução
2 Evolução
3 Ferramentas
4 Conclusão
Timbira - A empresa brasileira de PostgreSQL 16 / 54
Evolução
• 8.0
• warm standby
• 8.1
• warm standby (melhorias)
• 9.0
• replicação assíncrona
• hot standby
• protocolo de replicação
• 9.1
• replicação síncrona
• protocolo de replicação (melhorias)
• 9.2
• replicação síncrona (remote_write)
• cascateamento
• cópia base a partir do servidor réplica
Timbira - A empresa brasileira de PostgreSQL 17 / 54
Evolução
• 9.3
• seguir mudança de timeline
• gatilhos de eventos
• background workers
• 9.4
• slots de replicação
• logical decoding
• atraso configurável no servidor réplica
• 9.5
• acompanhar progresso da replicação lógica
• compressão do WAL
• monitoramento de slots de replicação
• 9.6
• múltiplos servidores síncronos
• balanceamento de leitura confiável (remote_apply)
• 10.0
• replicação lógica
• facilitar configuração de replicação (parâmetros padrão)
Timbira - A empresa brasileira de PostgreSQL 18 / 54
Planejamento
• mesma arquitetura
• 32 x 64 bits
• mesmo sistema operacional
• mesma versão do PostgreSQL
• 9.4.5 → 9.4.11 (funciona)
• 9.4.9 → 9.5.6 (não funciona)
• mesmos caminhos para tablespaces
• criar caminho nas réplicas antes de criar a tablespace no
servidor principal
Timbira - A empresa brasileira de PostgreSQL 19 / 54
Funcionamento
• cópia base: cópia de todo cluster para servidor réplica
• recuperação de registros do log de transação no servidor
réplica
• entrega
• arquivos
• fluxo (stream)
• walsender (servidor principal)
• walreceiver (servidor réplica)
• role
• somente fluxo
• privilégio REPLICATION (≥ 9.1)
• configuração
• postgresql.conf
• recovery.conf
Timbira - A empresa brasileira de PostgreSQL 20 / 54
Replicação por Arquivos: Arquitetura
• habilitar arquivamento para repositório
• realizar cópia base do servidor principal
• iniciar restauração contínua no servidor réplica
servidor em espera (10.1.1.2)
servidor primário (10.1.1.1)
Timbira - A empresa brasileira de PostgreSQL 21 / 54
Replicação por Arquivos
• restore_command: script ou software que espera
indefinidamente arquivo WAL
• pg_standby (≥ 8.3)
1 t r i g g e r e d = f a l s e ;
2 while ( ! NextWALFileReady () && ! t r i g g e r e d )
3 {
4 s l e e p (100000L) ; /* wait f o r ~0.1 sec */
5 i f ( CheckForExternalTrigger () )
6 t r i g g e r e d = true ;
7 }
8 i f ( ! t r i g g e r e d )
9 CopyWALFileForRecovery () ;
Timbira - A empresa brasileira de PostgreSQL 22 / 54
Replicação por Arquivos: No Principal
postgresql.conf
wal_level = replica # hot_standby se < 9.6
archive_mode = on
archive_command = ’scp %p usuario@10.1.1.2:/archives/%f’
Timbira - A empresa brasileira de PostgreSQL 23 / 54
Cópia Física: Serviço Parado
$ pg_ctl stop -D /bd/primario
waiting for server to shut down.... done
server stopped
$ rsync -av --exclude postgresql.conf 
--exclude pg_hba.conf --exclude pg_xlog/* 
--exclude pg_log/* /bd/primario/ 
postgres@10.1.1.2:/bd/secundario
$ pg_ctl start -D /bd/primario
server starting
Timbira - A empresa brasileira de PostgreSQL 24 / 54
Cópia Física: Serviço em Execução
postgres=# select pg_start_backup('replicacao', true);
pg_start_backup
-----------------
0/5044CB4
(1 row)
$ rsync -av --exclude postmaster.pid 
--exclude postgresql.conf --exclude pg_hba.conf 
--exclude pg_xlog/*  --exclude pg_log/* /bd/primario/ 
postgres@10.1.1.2:/bd/secundario
postgres=# select pg_stop_backup();
pg_stop_backup
----------------
0/90D7950
(1 row)
Timbira - A empresa brasileira de PostgreSQL 25 / 54
Replicação por Arquivos: Na Réplica
recovery.conf
restore_command = ’pg_standby -t /tmp/f.trg -d /archives %f
%p %r 2>>/tmp/stdby.log’
archive_cleanup_command = ’pg_archivecleanup /archives %r’
recovery_end_command = ’rm -f /tmp/f.trg’
postgresql.conf
hot_standby = on
Timbira - A empresa brasileira de PostgreSQL 26 / 54
Replicação por Fluxo: Arquitetura
• WALReceiver estabelece uma conexão (via libpq) com
servidor principal
• servidor principal abre o processo WalSender para enviar WAL
ao servidor réplica
• replicação síncrona espera WAL ser escrito e/ou aplicado no
servidor réplica
buffers
wal
WALReceiver
principal réplica
postgres
WALSender
postgres
WAL
conexão WAL
write?
sync?
replay?
Timbira - A empresa brasileira de PostgreSQL 27 / 54
Replicação por Fluxo: Assíncrona
• replicação por fluxo no PostgreSQL é assíncrona por padrão
• se o servidor principal cair, algumas transações que foram
efetivadas podem não ter sido replicadas
• a quantidade de dados perdidos é correspondente ao atraso da
replicação no momento da queda
Curiosidade
A partir da 9.4, é possível configurar o servidor réplica com atraso
predefinido
Timbira - A empresa brasileira de PostgreSQL 28 / 54
Replicação por Fluxo: Síncrona
• confirma que todas as mudanças feitas na transação foram
transferidas para pelo menos um servidor réplica
• cada transação que modifica dados esperará a confirmação
que as mudanças foram escritas no log de transação de
ambos servidores
• fornece um nível mais alto de durabilidade
Confiabilidade
A partir da 9.6, você pode exigir a resposta de n servidores réplica
antes de concluir a transação. Quorum Commit está disponível a
partir da 10.
Timbira - A empresa brasileira de PostgreSQL 29 / 54
Replicação por Fluxo: Síncrona
• tempo da transação
• transferir os dados entre servidor principal e réplica
• escrever dados no log de transação do servidor réplica
• mandar mensagem do servidor réplica para principal com ACK
• escrever dados no log de transação do servidor principal
• transações somente leitura, ROLLBACK e subtransações não
esperam resposta do servidor réplica
Timbira - A empresa brasileira de PostgreSQL 30 / 54
Replicação em Cascata
• servidor réplica aceita conexões para replicação de outros
servidores réplica
• replicação em cascata é assíncrona
• não há configuração especial para habilitar a replicação em
cascata
• se ≥ 9.3, capaz de seguir a nova timeline
Antes da 9.3
Promover um servidor réplica intermediário termina as conexões de
replicação; é necessário refazer as réplicas.
Timbira - A empresa brasileira de PostgreSQL 31 / 54
Replicação por Fluxo: No Principal
postgresql.conf
listen_addresses = ’*’
wal_level = replica # hot_standby se < 9.6
max_wal_senders = 3
max_replication_slots = 3
wal_keep_segments = 100
synchronous_standby_names = ’*’
Role de replicação
CREATE ROLE usuario LOGIN REPLICATION;
pg_hba.conf
host replication usuario 10.1.1.2/32 md5
Timbira - A empresa brasileira de PostgreSQL 32 / 54
Cópia Física: Serviço Parado
$ pg_ctl stop -D /bd/primario
waiting for server to shut down.... done
server stopped
$ rsync -av --exclude postgresql.conf 
--exclude pg_hba.conf --exclude pg_xlog/* 
--exclude pg_log/* /bd/primario/ 
postgres@10.1.1.2:/bd/secundario
$ pg_ctl start -D /bd/primario
server starting
Timbira - A empresa brasileira de PostgreSQL 33 / 54
Cópia Física: Serviço em Execução
postgres=# select pg_start_backup('replicacao', true);
pg_start_backup
-----------------
0/5044CB4
(1 row)
$ rsync -av --exclude postmaster.pid 
--exclude postgresql.conf --exclude pg_hba.conf 
--exclude pg_xlog/*  --exclude pg_log/* /bd/primario/ 
postgres@10.1.1.2:/bd/secundario
postgres=# select pg_stop_backup();
pg_stop_backup
----------------
0/90D7950
(1 row)
Timbira - A empresa brasileira de PostgreSQL 34 / 54
Cópia Física: pg_basebackup
$ pg_basebackup --pgdata=/bd/secundario --verbose 
> --write-recovery-conf --progress 
> --dbname='host=10.1.1.1 port=5432 user=usuario'
Timbira - A empresa brasileira de PostgreSQL 35 / 54
Replicação por Fluxo: Na Réplica
recovery.conf
standby_mode = ’on’
primary_conninfo = ’host=10.1.1.1 user=usuario password=1234’
trigger_file = ’/bd/secundario/failover.trg’
primary_slot_name = ’no1’
recovery_target_timeline = ’latest’
recovery_min_apply_delay = 2h
postgresql.conf
hot_standby = on
Timbira - A empresa brasileira de PostgreSQL 36 / 54
Replicação Lógica: No Principal
postgresql.conf
wal_level = logical
Role de replicação
CREATE ROLE usuario LOGIN;
pg_hba.conf
host foo usuario 10.1.1.2/32 md5
Publicar tabelas
foo=# create publication pub1 for table contas, historico, vendas;
CREATE PUBLICATION
Timbira - A empresa brasileira de PostgreSQL 37 / 54
Replicação Lógica: Na Réplica
Restaurar esquema
pg_dump -h 10.1.1.1 -s -U usuario foo | psql -f - -U timbira bar
Assinar tabelas
bar=# create subscription sub1 connection ’host=10.1.1.1
user=usuario dbname=foo’ publication pub1;
CREATE SUBSCRIPTION
Timbira - A empresa brasileira de PostgreSQL 38 / 54
Failover
• no pg_standby
• crie o arquivo especificado pela opção -t
• criar arquivo de gatilho (trigger_file)
• só tem efeito com standby_mode = on
• executar pg_ctl promote
Timbira - A empresa brasileira de PostgreSQL 39 / 54
Failback
• operação mais complicada do que failover
• servidor antigo pode conter dados que não estão presentes no
novo servidor principal
• não há como desfazer essas transações “perdidas” (não há log
de UNDO)
• a solução é:
• descartar dados do servidor antigo (considerar transações
“perdidas”?)
• montar replicação com o servidor antigo sendo a réplica do
novo servidor principal
• bloquear acesso ao PostgreSQL para promover servidor
• promover a réplica (servidor antigo)
• descartar dados do novo servidor (antiga réplica)
• montar replicação com cenário inicial
• o pg_rewind pode ajudar nessa tarefa
Timbira - A empresa brasileira de PostgreSQL 40 / 54
Monitoramento
• monitoramento
• pg_stat_replication (≥ 9.1) – principal
• pg_stat_database_conflicts (≥ 9.1) – réplica
• pg_stat_wal_receiver (≥ 9.6) – réplica
• pg_replication_slots (≥ 9.4)
• pg_current_xlog_location (principal) e
pg_last_xlog_{receive, replay}_location (réplica)
Timbira - A empresa brasileira de PostgreSQL 41 / 54
Monitoramento: No Principal
postgres=# SELECT * FROM pg_stat_replication;
-[ RECORD 1 ]----+------------------------------
pid | 7466
usesysid | 10
usename | replicacao
application_name | walreceiver
client_addr | 10.1.1.2
client_hostname |
client_port | 51981
backend_start | 2014-07-29 21:54:43.573871-03
backend_xmin |
state | streaming
sent_location | 0/16ACA50
write_location | 0/16ACA50
flush_location | 0/16ACA50
replay_location | 0/16ACA50
sync_priority | 0
sync_state | async
Timbira - A empresa brasileira de PostgreSQL 42 / 54
Atraso da Replicação
postgres=# SELECT pg_size_pretty(
pg_xlog_location_diff(sent_location, replay_location))
as replication_lag FROM pg_stat_replication;
replication_lag
-----------------
40 kB
(1 registro)
Até a 9.1
Não havia a função pg_xlog_location_diff.
Timbira - A empresa brasileira de PostgreSQL 43 / 54
Resumo
1 Introdução
2 Evolução
3 Ferramentas
4 Conclusão
Timbira - A empresa brasileira de PostgreSQL 44 / 54
Algumas ferramentas...
• rserv
• Slony-I
• Londiste
• Bucardo
• pgpool-II
• PGCluster
• pglogical
• BDR
• Postgres-XC → Postgres-X2
• Postgres-XL
Timbira - A empresa brasileira de PostgreSQL 45 / 54
BDR
• Bi-Directional Replication
• extensão do PostgreSQL
• incorporando funcionalidades aos poucos no repositório do
PostgreSQL
• suporta 9.3 e 9.4
• é necessário uma versão modificada do PostgreSQL
• o UDR pode rodar no 9.4 sem modificações
Timbira - A empresa brasileira de PostgreSQL 46 / 54
BDR: Comparativo
BDR HS Londiste Slony Bucardo
Multi-master sim não não ⋆ não sim
Por Banco sim não sim sim sim
Cascateamento não sim sim sim -
DDL sim sim não ⋆ não ⋆ não
Daemon externo não não sim sim sim
Novas Tabelas Adicionadas sim sim não não não
Sequências Transparentes sim - - - não
Usa gatilhos / Escrita 2x não não sim sim sim
UPDATE na PK sim sim não não não
Replicação Seletiva sim não sim sim sim
Aplica Txn Individual sim sim não não não
extraído do site do BDR
Timbira - A empresa brasileira de PostgreSQL 47 / 54
Postgres-XL
transações
leitura /
escritatimestamp
todos
mesmo
com
Timbira - A empresa brasileira de PostgreSQL 48 / 54
Postgres-XL
• arquitetura shared nothing
• multi-mestre síncrono
• escalável em leitura/escrita
• ”3,4x performance com 5 servidores comparado com um
servidor PostgreSQL”
• local de tabelas transparente
• tabelas replicadas
• tabelas distribuídas
• baseado no PostgreSQL (atualmente 9.5)
• mesma API para aplicações que já utilizam PostgreSQL
Timbira - A empresa brasileira de PostgreSQL 49 / 54
Postgres-XL: Arquitetura
servidor 1 servidor 2
Coordenador
Nó 1
Catálogo
Local
Coordenador
Catálogo
Global
Catálogo
Local
Catálogo
Global
Nó 2
GTM
GTM Proxy GTM Proxy
Aplicações
Timbira - A empresa brasileira de PostgreSQL 50 / 54
Resumo
1 Introdução
2 Evolução
3 Ferramentas
4 Conclusão
Timbira - A empresa brasileira de PostgreSQL 51 / 54
Outras inúmeras perguntas...
• A sua pergunta na lista pgbr-geral
• A sua pergunta na lista pgsql-{general, performance, admin}
• histórico das listas
• blogs
• http://planeta.postgresql.org.br
• http://planet.postgresql.org
• wiki
• http://wiki.postgresql.org
• IRC
• irc.freenode.net
• #postgresql
• #postgresql-br
Timbira - A empresa brasileira de PostgreSQL 52 / 54
Referências
• BDR: http://www.bdr-project.org/
• Bucardo: http://www.bucardo.org/
• Londiste:
https://wiki.postgresql.org/wiki/SkyTools
• Slony-I: http://www.slony.info/
• Postgres-XL: https:
//www.2ndquadrant.com/en/resources/postgres-xl/
• pgpool-II: http://www.pgpool.net/
Timbira - A empresa brasileira de PostgreSQL 53 / 54
Perguntas
?
Euler Taveira de Oliveira
euler@timbira.com.br
http://www.timbira.com.br
Timbira - A empresa brasileira de PostgreSQL 54 / 54

Mais conteúdo relacionado

PDF
SQL Performance Tuning and New Features in Oracle 19c
PDF
PostgreSQL continuous backup and PITR with Barman
 
PDF
Getting started with Spring Security
PPT
Hibernate
PDF
Introduction to Hibernate Framework
PDF
Troubleshooting Memory Problems in Java Applications
PPTX
Garbage First Garbage Collector (G1 GC): Current and Future Adaptability and ...
PDF
Oracle data guard for beginners
SQL Performance Tuning and New Features in Oracle 19c
PostgreSQL continuous backup and PITR with Barman
 
Getting started with Spring Security
Hibernate
Introduction to Hibernate Framework
Troubleshooting Memory Problems in Java Applications
Garbage First Garbage Collector (G1 GC): Current and Future Adaptability and ...
Oracle data guard for beginners

Semelhante a Desmistificando Replicação no PostgreSQL (20)

PDF
KrahoDB
PDF
Pgquarrel
PPTX
Sistemas Distribuídos - Replicação de Banco de Dados
PDF
Replicação Lógica no PostgreSQL 10
PPTX
Apresentação PGDAY - Replicação Nativa - PostgreSQL
PDF
Otimizacao de websites em PHP
PDF
Escalabilidade horizontal com PostgreSQL e Pgpool II
PPTX
Datasnap avançado - Respostas para um sistema robusto - Embarcadero Conferenc...
PDF
PDF
Big data e PostgreSQL
PDF
PostgreSQL Tuning: O elefante mais rápido que um leopardo
PDF
Dextra Sistemas: Novidades do PostgreSQL 9.0
PPTX
19-Sistemas Distribuidos.pptx
PDF
Escalando o ambiente com MariaDB Cluster (Portuguese Edition)
PPTX
Rodando a BlackFriday do seu eCommerce na nuvem
PDF
Gerenciamento de Backup e Recovery com Barman PGConfBrasil2019
PDF
Oracle e SQL Server na prática mitos, semelhanças e diferenças
PDF
Arquitetando Soluções de Dados com PostgreSQL
PDF
Análise comparativa entre as versões 3 e 4 do protocolo NFS em arquiteturas NAS
KrahoDB
Pgquarrel
Sistemas Distribuídos - Replicação de Banco de Dados
Replicação Lógica no PostgreSQL 10
Apresentação PGDAY - Replicação Nativa - PostgreSQL
Otimizacao de websites em PHP
Escalabilidade horizontal com PostgreSQL e Pgpool II
Datasnap avançado - Respostas para um sistema robusto - Embarcadero Conferenc...
Big data e PostgreSQL
PostgreSQL Tuning: O elefante mais rápido que um leopardo
Dextra Sistemas: Novidades do PostgreSQL 9.0
19-Sistemas Distribuidos.pptx
Escalando o ambiente com MariaDB Cluster (Portuguese Edition)
Rodando a BlackFriday do seu eCommerce na nuvem
Gerenciamento de Backup e Recovery com Barman PGConfBrasil2019
Oracle e SQL Server na prática mitos, semelhanças e diferenças
Arquitetando Soluções de Dados com PostgreSQL
Análise comparativa entre as versões 3 e 4 do protocolo NFS em arquiteturas NAS
Anúncio

Último (19)

PDF
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
PDF
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
PPTX
Aula 18 - Manipulacao De Arquivos python
PPTX
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
PPTX
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
PDF
Apple Pippin Uma breve introdução. - David Glotz
PDF
Aula04-Academia Heri- Tecnologia Geral 2025
PDF
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
PDF
COBITxITIL-Entenda as diferença em uso governança TI
PPTX
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
PDF
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
PDF
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
PDF
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
PPTX
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
PDF
Custos e liquidação no SAP Transportation Management, TM130 Col18
PDF
Processos na gestão de transportes, TM100 Col18
PPTX
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PDF
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
Aula 18 - Manipulacao De Arquivos python
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
Apple Pippin Uma breve introdução. - David Glotz
Aula04-Academia Heri- Tecnologia Geral 2025
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
COBITxITIL-Entenda as diferença em uso governança TI
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
Custos e liquidação no SAP Transportation Management, TM130 Col18
Processos na gestão de transportes, TM100 Col18
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
Anúncio

Desmistificando Replicação no PostgreSQL

  • 1. Desmistificando Replicação no PostgreSQL Euler Taveira São Paulo, 06/05/2017
  • 2. Sobre esta apresentação • esta apresentação está disponível em: http://www.timbira.com.br/material • esta apresentação está sob licença Creative Commons Atribuição-Não Comercial 3.0 Brasil: http://creativecommons.org/licenses/by-nc/3.0/br c b n
  • 3. Apresentação • Euler Taveira • Desenvolvedor PostgreSQL • Líder do PostgreSQL Brasil • @eulerto • http://eulerto.blogspot.com • Timbira • Diretor Técnico • A empresa brasileira de PostgreSQL • Consultoria • Desenvolvimento • Suporte 24x7 • Treinamento
  • 4. Resumo 1 Introdução 2 Evolução 3 Ferramentas 4 Conclusão Timbira - A empresa brasileira de PostgreSQL 1 / 54
  • 5. O que é? • perguntas mais frequentes • curiosidades • conceitos de bancos de dados • como fazer Timbira - A empresa brasileira de PostgreSQL 2 / 54
  • 6. O que não é? • tópicos avançados • comparação com soluções de outros SGBDs • soluções de replicação a nível de sistema de arquivos • soluções de replicação a nível de hardware Timbira - A empresa brasileira de PostgreSQL 3 / 54
  • 7. Um pouco de teoria... • ”Replicação significa que nós armazenamos várias cópias de uma relação ou partições dela em sites diferentes.” • Motivação: • aumentar a disponibilidade • problema na réplica • falha de comunicação • acelerar execução de uma consulta • réplica mais próxima pode executar consulta mais rápido • balancear a carga no SGBD • tolerância a falhas (SPOF) • Como manter a réplica quando a relação é modificada? • síncrono • assíncrono Timbira - A empresa brasileira de PostgreSQL 4 / 54
  • 8. Replicação Física: Hardware nó A nó B postgres off Timbira - A empresa brasileira de PostgreSQL 5 / 54
  • 9. Replicação Física: Sistema Operacional nó A nó B postgres off Timbira - A empresa brasileira de PostgreSQL 6 / 54
  • 10. Replicação Lógica nó A nó B Timbira - A empresa brasileira de PostgreSQL 7 / 54
  • 11. Granularidade • segmento de log de transação: quando um arquivo de log de transação é arquivado, ele é aplicado no outro nó • archive_timeout (longo) • buffer de log de transação: quando a transação é efetivada, ela é transmitida e efetivada no outro nó • ≾ 1 seg (curto) Streaming Replication Warm Standby (< 9.0) segmento #1 segmento #2 aplicar em caso de desastre Timbira - A empresa brasileira de PostgreSQL 8 / 54
  • 12. Uso do servidor réplica • warm standby: o servidor réplica não aceita conexões • hot standby: o servidor réplica aceita conexões Hot Standby Warm Standby principal réplica principal réplica Timbira - A empresa brasileira de PostgreSQL 9 / 54
  • 13. Alta Disponibilidade • manter o serviço disponível o máximo de tempo possível • parada • programada (manutenção) • não programada (falha / desastre) • Acordo de Nível de Serviço (SLA) • porcentagem do uptime / tempo • tempo médio para recuperação • tempo médio entre falhas Timbira - A empresa brasileira de PostgreSQL 10 / 54
  • 14. Alta Disponibilidade Disponibilidade Parada por ano Parada por mês 90% 36,5 dias 72 horas 99% 3,65 dias 7,2 horas 99,9% 8,76 horas 43,8 minutos 99,99% 52,56 minutos 4,32 minutos 99,999% 5,26 minutos 25,9 segundos 99,9999% 31,5 segundos 2,59 segundos 99,99999% 3,15 segundos 0,259 segundos Timbira - A empresa brasileira de PostgreSQL 11 / 54
  • 15. Failover • transferência do serviço em caso de falha • quando um servidor falha, outro servidor assume o seu serviço réplica principal principal antigo DEPOISANTES Timbira - A empresa brasileira de PostgreSQL 12 / 54
  • 16. Failback • retornar serviço ao servidor principal • estado anterior a falha principal antigo réplica principal ANTES DEPOIS Timbira - A empresa brasileira de PostgreSQL 13 / 54
  • 17. Cascateamento • servidor A replica para servidor B e C • servidor B replica para servidor D e E servidor A servidor C servidor E servidor B servidor D Timbira - A empresa brasileira de PostgreSQL 14 / 54
  • 18. Balanceamento de Carga • distribuir a carga entre diversos servidores • algoritmos de agendamento • randômico • round robin • carga assimétrica • otimizar a utilização de recursos • maximizar o desempenho • evitar sobrecarga Timbira - A empresa brasileira de PostgreSQL 15 / 54
  • 19. Resumo 1 Introdução 2 Evolução 3 Ferramentas 4 Conclusão Timbira - A empresa brasileira de PostgreSQL 16 / 54
  • 20. Evolução • 8.0 • warm standby • 8.1 • warm standby (melhorias) • 9.0 • replicação assíncrona • hot standby • protocolo de replicação • 9.1 • replicação síncrona • protocolo de replicação (melhorias) • 9.2 • replicação síncrona (remote_write) • cascateamento • cópia base a partir do servidor réplica Timbira - A empresa brasileira de PostgreSQL 17 / 54
  • 21. Evolução • 9.3 • seguir mudança de timeline • gatilhos de eventos • background workers • 9.4 • slots de replicação • logical decoding • atraso configurável no servidor réplica • 9.5 • acompanhar progresso da replicação lógica • compressão do WAL • monitoramento de slots de replicação • 9.6 • múltiplos servidores síncronos • balanceamento de leitura confiável (remote_apply) • 10.0 • replicação lógica • facilitar configuração de replicação (parâmetros padrão) Timbira - A empresa brasileira de PostgreSQL 18 / 54
  • 22. Planejamento • mesma arquitetura • 32 x 64 bits • mesmo sistema operacional • mesma versão do PostgreSQL • 9.4.5 → 9.4.11 (funciona) • 9.4.9 → 9.5.6 (não funciona) • mesmos caminhos para tablespaces • criar caminho nas réplicas antes de criar a tablespace no servidor principal Timbira - A empresa brasileira de PostgreSQL 19 / 54
  • 23. Funcionamento • cópia base: cópia de todo cluster para servidor réplica • recuperação de registros do log de transação no servidor réplica • entrega • arquivos • fluxo (stream) • walsender (servidor principal) • walreceiver (servidor réplica) • role • somente fluxo • privilégio REPLICATION (≥ 9.1) • configuração • postgresql.conf • recovery.conf Timbira - A empresa brasileira de PostgreSQL 20 / 54
  • 24. Replicação por Arquivos: Arquitetura • habilitar arquivamento para repositório • realizar cópia base do servidor principal • iniciar restauração contínua no servidor réplica servidor em espera (10.1.1.2) servidor primário (10.1.1.1) Timbira - A empresa brasileira de PostgreSQL 21 / 54
  • 25. Replicação por Arquivos • restore_command: script ou software que espera indefinidamente arquivo WAL • pg_standby (≥ 8.3) 1 t r i g g e r e d = f a l s e ; 2 while ( ! NextWALFileReady () && ! t r i g g e r e d ) 3 { 4 s l e e p (100000L) ; /* wait f o r ~0.1 sec */ 5 i f ( CheckForExternalTrigger () ) 6 t r i g g e r e d = true ; 7 } 8 i f ( ! t r i g g e r e d ) 9 CopyWALFileForRecovery () ; Timbira - A empresa brasileira de PostgreSQL 22 / 54
  • 26. Replicação por Arquivos: No Principal postgresql.conf wal_level = replica # hot_standby se < 9.6 archive_mode = on archive_command = ’scp %p usuario@10.1.1.2:/archives/%f’ Timbira - A empresa brasileira de PostgreSQL 23 / 54
  • 27. Cópia Física: Serviço Parado $ pg_ctl stop -D /bd/primario waiting for server to shut down.... done server stopped $ rsync -av --exclude postgresql.conf --exclude pg_hba.conf --exclude pg_xlog/* --exclude pg_log/* /bd/primario/ postgres@10.1.1.2:/bd/secundario $ pg_ctl start -D /bd/primario server starting Timbira - A empresa brasileira de PostgreSQL 24 / 54
  • 28. Cópia Física: Serviço em Execução postgres=# select pg_start_backup('replicacao', true); pg_start_backup ----------------- 0/5044CB4 (1 row) $ rsync -av --exclude postmaster.pid --exclude postgresql.conf --exclude pg_hba.conf --exclude pg_xlog/* --exclude pg_log/* /bd/primario/ postgres@10.1.1.2:/bd/secundario postgres=# select pg_stop_backup(); pg_stop_backup ---------------- 0/90D7950 (1 row) Timbira - A empresa brasileira de PostgreSQL 25 / 54
  • 29. Replicação por Arquivos: Na Réplica recovery.conf restore_command = ’pg_standby -t /tmp/f.trg -d /archives %f %p %r 2>>/tmp/stdby.log’ archive_cleanup_command = ’pg_archivecleanup /archives %r’ recovery_end_command = ’rm -f /tmp/f.trg’ postgresql.conf hot_standby = on Timbira - A empresa brasileira de PostgreSQL 26 / 54
  • 30. Replicação por Fluxo: Arquitetura • WALReceiver estabelece uma conexão (via libpq) com servidor principal • servidor principal abre o processo WalSender para enviar WAL ao servidor réplica • replicação síncrona espera WAL ser escrito e/ou aplicado no servidor réplica buffers wal WALReceiver principal réplica postgres WALSender postgres WAL conexão WAL write? sync? replay? Timbira - A empresa brasileira de PostgreSQL 27 / 54
  • 31. Replicação por Fluxo: Assíncrona • replicação por fluxo no PostgreSQL é assíncrona por padrão • se o servidor principal cair, algumas transações que foram efetivadas podem não ter sido replicadas • a quantidade de dados perdidos é correspondente ao atraso da replicação no momento da queda Curiosidade A partir da 9.4, é possível configurar o servidor réplica com atraso predefinido Timbira - A empresa brasileira de PostgreSQL 28 / 54
  • 32. Replicação por Fluxo: Síncrona • confirma que todas as mudanças feitas na transação foram transferidas para pelo menos um servidor réplica • cada transação que modifica dados esperará a confirmação que as mudanças foram escritas no log de transação de ambos servidores • fornece um nível mais alto de durabilidade Confiabilidade A partir da 9.6, você pode exigir a resposta de n servidores réplica antes de concluir a transação. Quorum Commit está disponível a partir da 10. Timbira - A empresa brasileira de PostgreSQL 29 / 54
  • 33. Replicação por Fluxo: Síncrona • tempo da transação • transferir os dados entre servidor principal e réplica • escrever dados no log de transação do servidor réplica • mandar mensagem do servidor réplica para principal com ACK • escrever dados no log de transação do servidor principal • transações somente leitura, ROLLBACK e subtransações não esperam resposta do servidor réplica Timbira - A empresa brasileira de PostgreSQL 30 / 54
  • 34. Replicação em Cascata • servidor réplica aceita conexões para replicação de outros servidores réplica • replicação em cascata é assíncrona • não há configuração especial para habilitar a replicação em cascata • se ≥ 9.3, capaz de seguir a nova timeline Antes da 9.3 Promover um servidor réplica intermediário termina as conexões de replicação; é necessário refazer as réplicas. Timbira - A empresa brasileira de PostgreSQL 31 / 54
  • 35. Replicação por Fluxo: No Principal postgresql.conf listen_addresses = ’*’ wal_level = replica # hot_standby se < 9.6 max_wal_senders = 3 max_replication_slots = 3 wal_keep_segments = 100 synchronous_standby_names = ’*’ Role de replicação CREATE ROLE usuario LOGIN REPLICATION; pg_hba.conf host replication usuario 10.1.1.2/32 md5 Timbira - A empresa brasileira de PostgreSQL 32 / 54
  • 36. Cópia Física: Serviço Parado $ pg_ctl stop -D /bd/primario waiting for server to shut down.... done server stopped $ rsync -av --exclude postgresql.conf --exclude pg_hba.conf --exclude pg_xlog/* --exclude pg_log/* /bd/primario/ postgres@10.1.1.2:/bd/secundario $ pg_ctl start -D /bd/primario server starting Timbira - A empresa brasileira de PostgreSQL 33 / 54
  • 37. Cópia Física: Serviço em Execução postgres=# select pg_start_backup('replicacao', true); pg_start_backup ----------------- 0/5044CB4 (1 row) $ rsync -av --exclude postmaster.pid --exclude postgresql.conf --exclude pg_hba.conf --exclude pg_xlog/* --exclude pg_log/* /bd/primario/ postgres@10.1.1.2:/bd/secundario postgres=# select pg_stop_backup(); pg_stop_backup ---------------- 0/90D7950 (1 row) Timbira - A empresa brasileira de PostgreSQL 34 / 54
  • 38. Cópia Física: pg_basebackup $ pg_basebackup --pgdata=/bd/secundario --verbose > --write-recovery-conf --progress > --dbname='host=10.1.1.1 port=5432 user=usuario' Timbira - A empresa brasileira de PostgreSQL 35 / 54
  • 39. Replicação por Fluxo: Na Réplica recovery.conf standby_mode = ’on’ primary_conninfo = ’host=10.1.1.1 user=usuario password=1234’ trigger_file = ’/bd/secundario/failover.trg’ primary_slot_name = ’no1’ recovery_target_timeline = ’latest’ recovery_min_apply_delay = 2h postgresql.conf hot_standby = on Timbira - A empresa brasileira de PostgreSQL 36 / 54
  • 40. Replicação Lógica: No Principal postgresql.conf wal_level = logical Role de replicação CREATE ROLE usuario LOGIN; pg_hba.conf host foo usuario 10.1.1.2/32 md5 Publicar tabelas foo=# create publication pub1 for table contas, historico, vendas; CREATE PUBLICATION Timbira - A empresa brasileira de PostgreSQL 37 / 54
  • 41. Replicação Lógica: Na Réplica Restaurar esquema pg_dump -h 10.1.1.1 -s -U usuario foo | psql -f - -U timbira bar Assinar tabelas bar=# create subscription sub1 connection ’host=10.1.1.1 user=usuario dbname=foo’ publication pub1; CREATE SUBSCRIPTION Timbira - A empresa brasileira de PostgreSQL 38 / 54
  • 42. Failover • no pg_standby • crie o arquivo especificado pela opção -t • criar arquivo de gatilho (trigger_file) • só tem efeito com standby_mode = on • executar pg_ctl promote Timbira - A empresa brasileira de PostgreSQL 39 / 54
  • 43. Failback • operação mais complicada do que failover • servidor antigo pode conter dados que não estão presentes no novo servidor principal • não há como desfazer essas transações “perdidas” (não há log de UNDO) • a solução é: • descartar dados do servidor antigo (considerar transações “perdidas”?) • montar replicação com o servidor antigo sendo a réplica do novo servidor principal • bloquear acesso ao PostgreSQL para promover servidor • promover a réplica (servidor antigo) • descartar dados do novo servidor (antiga réplica) • montar replicação com cenário inicial • o pg_rewind pode ajudar nessa tarefa Timbira - A empresa brasileira de PostgreSQL 40 / 54
  • 44. Monitoramento • monitoramento • pg_stat_replication (≥ 9.1) – principal • pg_stat_database_conflicts (≥ 9.1) – réplica • pg_stat_wal_receiver (≥ 9.6) – réplica • pg_replication_slots (≥ 9.4) • pg_current_xlog_location (principal) e pg_last_xlog_{receive, replay}_location (réplica) Timbira - A empresa brasileira de PostgreSQL 41 / 54
  • 45. Monitoramento: No Principal postgres=# SELECT * FROM pg_stat_replication; -[ RECORD 1 ]----+------------------------------ pid | 7466 usesysid | 10 usename | replicacao application_name | walreceiver client_addr | 10.1.1.2 client_hostname | client_port | 51981 backend_start | 2014-07-29 21:54:43.573871-03 backend_xmin | state | streaming sent_location | 0/16ACA50 write_location | 0/16ACA50 flush_location | 0/16ACA50 replay_location | 0/16ACA50 sync_priority | 0 sync_state | async Timbira - A empresa brasileira de PostgreSQL 42 / 54
  • 46. Atraso da Replicação postgres=# SELECT pg_size_pretty( pg_xlog_location_diff(sent_location, replay_location)) as replication_lag FROM pg_stat_replication; replication_lag ----------------- 40 kB (1 registro) Até a 9.1 Não havia a função pg_xlog_location_diff. Timbira - A empresa brasileira de PostgreSQL 43 / 54
  • 47. Resumo 1 Introdução 2 Evolução 3 Ferramentas 4 Conclusão Timbira - A empresa brasileira de PostgreSQL 44 / 54
  • 48. Algumas ferramentas... • rserv • Slony-I • Londiste • Bucardo • pgpool-II • PGCluster • pglogical • BDR • Postgres-XC → Postgres-X2 • Postgres-XL Timbira - A empresa brasileira de PostgreSQL 45 / 54
  • 49. BDR • Bi-Directional Replication • extensão do PostgreSQL • incorporando funcionalidades aos poucos no repositório do PostgreSQL • suporta 9.3 e 9.4 • é necessário uma versão modificada do PostgreSQL • o UDR pode rodar no 9.4 sem modificações Timbira - A empresa brasileira de PostgreSQL 46 / 54
  • 50. BDR: Comparativo BDR HS Londiste Slony Bucardo Multi-master sim não não ⋆ não sim Por Banco sim não sim sim sim Cascateamento não sim sim sim - DDL sim sim não ⋆ não ⋆ não Daemon externo não não sim sim sim Novas Tabelas Adicionadas sim sim não não não Sequências Transparentes sim - - - não Usa gatilhos / Escrita 2x não não sim sim sim UPDATE na PK sim sim não não não Replicação Seletiva sim não sim sim sim Aplica Txn Individual sim sim não não não extraído do site do BDR Timbira - A empresa brasileira de PostgreSQL 47 / 54
  • 52. Postgres-XL • arquitetura shared nothing • multi-mestre síncrono • escalável em leitura/escrita • ”3,4x performance com 5 servidores comparado com um servidor PostgreSQL” • local de tabelas transparente • tabelas replicadas • tabelas distribuídas • baseado no PostgreSQL (atualmente 9.5) • mesma API para aplicações que já utilizam PostgreSQL Timbira - A empresa brasileira de PostgreSQL 49 / 54
  • 53. Postgres-XL: Arquitetura servidor 1 servidor 2 Coordenador Nó 1 Catálogo Local Coordenador Catálogo Global Catálogo Local Catálogo Global Nó 2 GTM GTM Proxy GTM Proxy Aplicações Timbira - A empresa brasileira de PostgreSQL 50 / 54
  • 54. Resumo 1 Introdução 2 Evolução 3 Ferramentas 4 Conclusão Timbira - A empresa brasileira de PostgreSQL 51 / 54
  • 55. Outras inúmeras perguntas... • A sua pergunta na lista pgbr-geral • A sua pergunta na lista pgsql-{general, performance, admin} • histórico das listas • blogs • http://planeta.postgresql.org.br • http://planet.postgresql.org • wiki • http://wiki.postgresql.org • IRC • irc.freenode.net • #postgresql • #postgresql-br Timbira - A empresa brasileira de PostgreSQL 52 / 54
  • 56. Referências • BDR: http://www.bdr-project.org/ • Bucardo: http://www.bucardo.org/ • Londiste: https://wiki.postgresql.org/wiki/SkyTools • Slony-I: http://www.slony.info/ • Postgres-XL: https: //www.2ndquadrant.com/en/resources/postgres-xl/ • pgpool-II: http://www.pgpool.net/ Timbira - A empresa brasileira de PostgreSQL 53 / 54
  • 57. Perguntas ? Euler Taveira de Oliveira euler@timbira.com.br http://www.timbira.com.br Timbira - A empresa brasileira de PostgreSQL 54 / 54