SlideShare uma empresa Scribd logo
Eric Ferreira | ericfe@amazon.com | @ericnf
Senior Database Engineer
Amazon Redshift
Vários Tutoriais , treinamentos e mentoria em
português
Inscreva-se agora !!
http://awshub.com.br
Data Warehousing do jeito AWS
Pague pelo uso
Alta performance a um preço baixo
Suporte a ferramentas padrão (SQL)
Fácil de provisionar
Nosso objetivo foi criar…
Um serviço de DW simples, rápido e escalável. O resultado foi
~ 10x mais rápido
~ 10x menos custo
fácil de usar
Amazon Redshift
Alguns resultados dos Clientes Redshift
Consultas 5x – 20x mais rápidas;
Redução de 4x no custo comparado a HIVE
Redução de 20x – 40x tempo de consulta
Redução de 50% em custo,
Consultas 2x mais rápidas
Amazon Redshift reduz I/O
• Compressão de dados
• “Zone maps”
• Disco local
• Blocos de dados grande
ID Age State Amount
123 20 CA 500
345 25 WA 250
678 40 FL 125
957 37 WA 375
• Não precisa acessar ou retornar
todas as colunas para calcular a
soma de “Amount”
Amazon Redshift reduz I/O
• Banco de dados colunar
• Compressão de dados
• “Zone maps”
• Disco local
• Blocos de dados grande
• Compressão por coluna reduz o uso
de espaço e acelera leitura
• Amazon Redshift pode fazer a
escolha para você,
automaticamente
analyze compression listing;
Table | Column | Encoding
---------+----------------+----------
listing | listid | delta
listing | sellerid | delta32k
listing | eventid | delta32k
listing | dateid | bytedict
listing | numtickets | bytedict
listing | priceperticket | delta32k
listing | totalprice | mostly32
listing | listtime | raw
Amazon Redshift reduz I/O
• Banco de dados colunar
• Compressão de dados
• “Zone maps”
• Disco local
• Blocos de dados grande
• Cada bloco registra o valor
mínimo/máximo, em memória.
• Blocos que não vão satisfazer o
filtro, não são lidos.
• O I/O mais rápido é aquele que
não precisa ser feito.
Amazon Redshift reduz I/O
• Banco de dados colunar
• Compressão de dados
• “Zone maps”
• Disco local
• Blocos de dados grande
• Disco local maximiza a taxa de
transferência
• Hardware otimizado para
processamento de informação
• Bloco grande aproveita cada
acesso
• Amazon Redshift garante a
durabilidade dos dados
Arquitetura do Amazon Redshift
• Nó Líder
– SQL
– Armazena meta-data
– Coordena execução
• Nó Computacional
– Armazenamento local e colunar
– Consultas executam em paralelo
– Carga, Backup/Restore usa Amazon S3
– Carga em paralelo com Amazon DynamoDB
• Opção de nó único disponível
10 GigE
(HPC)
Ingestion
Backup
Restore
JDBC/ODBC
Amazon Redshift usa hardware customizado
HS1.8XL: 128 GB RAM, 16 Cores, 24 discos, 16 TB espaço comprimido, 2 GB/sec taxa de busca
HS1.XL: 16 GB RAM, 2 Cores, 3 discos, 2 TB espaço comprimido
• Otimizado para I/O intenso
• Alta densidade de disco
• Usa HPC – Rede de 10 Gbit/sec
• HS1.8XL disponível no Amazon EC2
Amazon Redshift = Tudo em Paralelo
• Consulta
• Carga de Dados
• Backup/Restore
• Elasticidade
Amazon Redshift = Tudo em Paralelo
• Consulta
• Carga de Dados
• Backup/Restore
• Elasticidade • Carga em paralelo do S3 ou
DynamoDB
• Dados automaticamente distribuídos
e ordenados de acordo com o DDL
• Escala linearmente com o número de
nós.
Amazon Redshift = Tudo em Paralelo
• Consulta
• Carga de Dados
• Backup/Restore
• Elasticidade
• Backups para S3 é automático,
continuo e incremental
• Período de retenção configurável
• Copias manuais usando API e
console web
• “Streaming restores” possibilitam
estar on-line mais rápido.
Amazon Redshift = Tudo em Paralelo
• Consulta
• Carga de Dados
• Backup/Restore
• Elasticidade
• Ampliação/redução acontece on-line
(leitura)
• Provisionamento invisível
• Dados transferidos em paralelo por nó
• Você só paga o cluster origem durante
o processo.
Amazon Redshift = Tudo em Paralelo
• Consulta
• Carga de Dados
• Backup/Restore
• Elasticidade
• DNS é atualizado automaticamente
• Cluster original é descartado
• Operação simples usando AWS
Console ou API
Amazon Redshift permite que você comece pequeno e cresça
Extra Large Node (HS1.XL)
3 spindles, 2 TB, 16 GB RAM, 2 cores
Nó Único (2 TB)
Cluster 2-32 Nós (4 TB – 64 TB)
8x Extra Large Node (HS1.8XL)
24 spindles, 16 TB, 128 GB RAM, 16 cores, 10 GigE
Cluster 2-100 Nós (32 TB – 1.6 PB)
Amazon Redshift : preço permite analisar todos os seus dados
Preço por Hora/Nó
HS1.XL
Preço por Hora/TB Preço por Ano/TB
On-Demand $ 0.850 $ 0.425 $ 3,723
Reserva 1 ano $ 0.500 $ 0.250 $ 2,190
Reserva 3 anos $ 0.228 $ 0.114 $ 999
Preço Simples
Número de nós x Custo por hora
Sem custo para o nó líder
Pague pelo uso
Amazon Redshift é fácil de usar
• Provisionamento em Minutos
• Monitoramento de Performance
• Elasticidade simples
• Segurança embutida
• Backups automáticos
Provisionamento em Minutos
Monitoramento de Performance
Elasticidade simples
Segurança embutida
• SSL garante segurança de transmissão
• Criptografia protege dados em repouso
– AES-256; aceleração por hardware
– Todos os blocos em disco e no Amazon
S3 criptografados
• Sem acesso direto a nós de computação
• Suporta Amazon VPC
10 GigE
(HPC)
Ingestion
Backup
Restore
Customer VPC
Internal
VPC
JDBC/ODBC
Amazon Redshift: Operação Simples
• Replicação de dados em múltiplos nos e copia para S3 garante durabilidade.
• Backups para Amazon S3 contínuo, automático e incremental.
– Projetado para 11 noves de durabilidade
• Monitoramento contínuo e recuperação automática de falhas de drives e nós
• Capaz de restaurar para qualquer zona de disponibilidade (AZ) dentro de uma região
Amazon Redshift integra com varias fontes de dados
Amazon
DynamoDB
Amazon Elastic
MapReduce
Amazon Simple
Storage Service (S3)
Amazon Elastic
Compute Cloud (EC2)
AWS Storage
Gateway Service
Corporate
Data Center
Amazon Relational
Database Service
(RDS)
Amazon
Redshift
Mais opções em breve …
Amazon Redshift várias opções de carga de dados
• Amazon S3
• AWS Direct Connect
• AWS Import/Export
• Parceiros
Mais opções em breve …
Data Integration Systems Integrators
Amazon Redshift compatível com suas ferramentas
JDBC/ODBC
Amazon Redshift
Mais opções em breve …
Dicas Práticas para começar com Redshift
• Prepare-se para adaptar seu processo ETL/ELT para tirar vantagem das
características da Amazon Cloud
• Reserve tempo para testar configurações diferentes
– Distkey, sortkey, ,compressão
– Número de nós e filas (WLM)
• Use S3/Glacier para arquivamento de dados (UNLOAD)
• Simule partições cronológicas com tabelas separadas e visões
• Considere Carga -> Duplicação -> Consultas para situações apropriadas
• De-normalize apenas para evitar JOIN onde distkey das tabelas não casa
Mais informações - Q&A
• Eric Ferreira | ericfe@amazon.com | @ericnf
• http://aws.amazon.com/redshift
• https://aws.amazon.com/marketplace/redshift/
• “Best Practices”
– http://docs.aws.amazon.com/redshift/latest/dg/c_loading-data-best-practices.html
– http://docs.aws.amazon.com/redshift/latest/dg/c_designing-tables-best-practices.html
– http://docs.aws.amazon.com/redshift/latest/dg/c-optimizing-query-performance.html

Mais conteúdo relacionado

PDF
Continuous Deployment e DevOps na Nuvem
PDF
Conhecendo as opcoes de Storage na Nuvem da AWS
PDF
Conhecendo o AWS Elastic Beanstalk
PDF
Otimizando e reduzindo custos na Nuvem da AWS
PDF
Whole Site Delivery with Amazon CloudFront
PDF
Conhecendo as Opcoes de Bancos de Dados na Nuvem da AWS
PDF
Primeira Semana na Nuvem da AWS
PPTX
Rodando SAP na AWS
Continuous Deployment e DevOps na Nuvem
Conhecendo as opcoes de Storage na Nuvem da AWS
Conhecendo o AWS Elastic Beanstalk
Otimizando e reduzindo custos na Nuvem da AWS
Whole Site Delivery with Amazon CloudFront
Conhecendo as Opcoes de Bancos de Dados na Nuvem da AWS
Primeira Semana na Nuvem da AWS
Rodando SAP na AWS

Mais procurados (20)

PDF
Utilizando NoSQL para Big Data com DynamoDB
PPTX
Iniciando com Amazon Cloudfront
PDF
Construindo um Data Lake na AWS
PPTX
Amazon EC2 boas praticas e otimizações de desempenho
PDF
Construindo sua Infraestrutura de Videos e Conteudos na Nuvem
PDF
Building blocks #4 - Rede de entrega de conteúdo (CDN) na AWS
PPTX
Migrando seu workload de Big Data para o Amazon EMR
PDF
Blue Green Deployments com Elastic Beanstalk - Demo Session
PDF
Path to the Future #1 - Tendências de Big Data
PDF
Arquiteturas de Alta Disponibilidade na AWS
PDF
Explorando o poder do banco de dados com Amazon Aurora
PDF
Backup e Disaster Recovery na Nuvem
PPTX
Iniciando com Amazon Aurora
PDF
Melhores práticas de workloads Microsoft na AWS
PDF
Path to the future #5 - Melhores práticas de data warehouse no Amazon Redshift
PDF
TCO e otimização de custos na AWS
PPTX
Tendências de Big Data
PDF
Construindo APIs com Amazon API Gateway e AWS Lambda
PPTX
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
PDF
Building blocks #5 - Recuperação de desastres de maneira prática na AWS
Utilizando NoSQL para Big Data com DynamoDB
Iniciando com Amazon Cloudfront
Construindo um Data Lake na AWS
Amazon EC2 boas praticas e otimizações de desempenho
Construindo sua Infraestrutura de Videos e Conteudos na Nuvem
Building blocks #4 - Rede de entrega de conteúdo (CDN) na AWS
Migrando seu workload de Big Data para o Amazon EMR
Blue Green Deployments com Elastic Beanstalk - Demo Session
Path to the Future #1 - Tendências de Big Data
Arquiteturas de Alta Disponibilidade na AWS
Explorando o poder do banco de dados com Amazon Aurora
Backup e Disaster Recovery na Nuvem
Iniciando com Amazon Aurora
Melhores práticas de workloads Microsoft na AWS
Path to the future #5 - Melhores práticas de data warehouse no Amazon Redshift
TCO e otimização de custos na AWS
Tendências de Big Data
Construindo APIs com Amazon API Gateway e AWS Lambda
Migrando seu banco de dados para a AWS - Deep Dive em Amazon RDS e AWS Databa...
Building blocks #5 - Recuperação de desastres de maneira prática na AWS
Anúncio

Destaque (20)

PDF
Introdução ao Amazon Redshift
PDF
Construindo Aplicacoes Web e Mobile Escalaveis na AWS
PDF
Keynote AWS Summit 2013 Sao Paulo
PDF
Como criar sua startup gratuitamente na Nuvem da AWS
PPTX
Mitos e Verdades sobre Cloud Computing
PDF
Amazon emr cluster hadoop pronto para usar na nuvem aws
PDF
Como a Amazon Web Services pode ajudar sua startup ou empresa a crescer e pro...
PDF
Introducao à Nuvem da Amazon Web Services
PPTX
Cloud Publica Com alta performance, flexível e gerenciável.
PPTX
Bem vindo a era da Inovação da TI com Cloud
PPTX
Apresentação comercial
PPTX
Palestra de Cloud para Universidade de São Caetano do Sul - USCS
PDF
Introducing Elastic MapReduce
PPTX
O futuro do DataCenter mora na Cloud
PDF
Conhecendo o DynamoDB
PPT
O que é Cloud Computing
PDF
Webinar: Primeiros Passos na Amazon Web Services
PDF
Cloud e suas tendências futuras (IoT, Analytics e Watson)
PDF
Infográfico Data Center Cloud IBM SoftLayer no Brasil
PPTX
Cloud30 E-Commerce
Introdução ao Amazon Redshift
Construindo Aplicacoes Web e Mobile Escalaveis na AWS
Keynote AWS Summit 2013 Sao Paulo
Como criar sua startup gratuitamente na Nuvem da AWS
Mitos e Verdades sobre Cloud Computing
Amazon emr cluster hadoop pronto para usar na nuvem aws
Como a Amazon Web Services pode ajudar sua startup ou empresa a crescer e pro...
Introducao à Nuvem da Amazon Web Services
Cloud Publica Com alta performance, flexível e gerenciável.
Bem vindo a era da Inovação da TI com Cloud
Apresentação comercial
Palestra de Cloud para Universidade de São Caetano do Sul - USCS
Introducing Elastic MapReduce
O futuro do DataCenter mora na Cloud
Conhecendo o DynamoDB
O que é Cloud Computing
Webinar: Primeiros Passos na Amazon Web Services
Cloud e suas tendências futuras (IoT, Analytics e Watson)
Infográfico Data Center Cloud IBM SoftLayer no Brasil
Cloud30 E-Commerce
Anúncio

Semelhante a Introducao ao Amazon Redshift (20)

PDF
Webinar: Data warehouse na nuvem da AWS
PDF
Começando com Amazon Redshift
PPTX
AWS Redshift Primer
PDF
Bancos de Dados gerenciados na nuvem AWS
PDF
Construindo um Data Warehouse moderno com Amazon Redshift
PDF
Amazon Redshift
PDF
AWS Redshift Primer
PPTX
Webinar: Introdução a Big data
PPTX
AWS Meetup Rio - Qual banco usar e quando?
PPTX
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
ODP
Redshift
PDF
Inovacao em-escala-final
PPTX
Quais são as opções de banco de dados gerenciados na AWS?
PPTX
Tendências de Big Data
PPTX
Tendências de Big Data
PPTX
Construindo seu Data Lake na AWS
PPTX
Iniciando com serviços de bancos de dados gerenciados na AWS
PPTX
Construção da Plataforma de dados Autônoma e em Escala
PPTX
Iniciando com Amazon DynamoDB
PDF
Primeira aplicacao big data
Webinar: Data warehouse na nuvem da AWS
Começando com Amazon Redshift
AWS Redshift Primer
Bancos de Dados gerenciados na nuvem AWS
Construindo um Data Warehouse moderno com Amazon Redshift
Amazon Redshift
AWS Redshift Primer
Webinar: Introdução a Big data
AWS Meetup Rio - Qual banco usar e quando?
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Redshift
Inovacao em-escala-final
Quais são as opções de banco de dados gerenciados na AWS?
Tendências de Big Data
Tendências de Big Data
Construindo seu Data Lake na AWS
Iniciando com serviços de bancos de dados gerenciados na AWS
Construção da Plataforma de dados Autônoma e em Escala
Iniciando com Amazon DynamoDB
Primeira aplicacao big data

Mais de Amazon Web Services LATAM (20)

PPTX
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
PPTX
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
PPTX
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
PPTX
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
PPTX
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
PPTX
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
PPTX
Automatice el proceso de entrega con CI/CD en AWS
PPTX
Automatize seu processo de entrega de software com CI/CD na AWS
PPTX
Cómo empezar con Amazon EKS
PPTX
Como começar com Amazon EKS
PPTX
Ransomware: como recuperar os seus dados na nuvem AWS
PPTX
Ransomware: cómo recuperar sus datos en la nube de AWS
PPTX
Ransomware: Estratégias de Mitigação
PPTX
Ransomware: Estratégias de Mitigación
PPTX
Aprenda a migrar y transferir datos al usar la nube de AWS
PPTX
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
PPTX
Cómo mover a un almacenamiento de archivos administrados
PPTX
Simplifique su BI con AWS
PPTX
Simplifique o seu BI com a AWS
PPTX
Os benefícios de migrar seus workloads de Big Data para a AWS
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
AWS para terceiro setor - Sessão 1 - Introdução à nuvem
AWS para terceiro setor - Sessão 2 - Armazenamento e Backup
AWS para terceiro setor - Sessão 3 - Protegendo seus dados.
Automatice el proceso de entrega con CI/CD en AWS
Automatize seu processo de entrega de software com CI/CD na AWS
Cómo empezar con Amazon EKS
Como começar com Amazon EKS
Ransomware: como recuperar os seus dados na nuvem AWS
Ransomware: cómo recuperar sus datos en la nube de AWS
Ransomware: Estratégias de Mitigação
Ransomware: Estratégias de Mitigación
Aprenda a migrar y transferir datos al usar la nube de AWS
Aprenda como migrar e transferir dados ao utilizar a nuvem da AWS
Cómo mover a un almacenamiento de archivos administrados
Simplifique su BI con AWS
Simplifique o seu BI com a AWS
Os benefícios de migrar seus workloads de Big Data para a AWS

Introducao ao Amazon Redshift

  • 1. Eric Ferreira | ericfe@amazon.com | @ericnf Senior Database Engineer Amazon Redshift
  • 2. Vários Tutoriais , treinamentos e mentoria em português Inscreva-se agora !! http://awshub.com.br
  • 3. Data Warehousing do jeito AWS Pague pelo uso Alta performance a um preço baixo Suporte a ferramentas padrão (SQL) Fácil de provisionar
  • 4. Nosso objetivo foi criar… Um serviço de DW simples, rápido e escalável. O resultado foi ~ 10x mais rápido ~ 10x menos custo fácil de usar Amazon Redshift
  • 5. Alguns resultados dos Clientes Redshift Consultas 5x – 20x mais rápidas; Redução de 4x no custo comparado a HIVE Redução de 20x – 40x tempo de consulta Redução de 50% em custo, Consultas 2x mais rápidas
  • 6. Amazon Redshift reduz I/O • Compressão de dados • “Zone maps” • Disco local • Blocos de dados grande ID Age State Amount 123 20 CA 500 345 25 WA 250 678 40 FL 125 957 37 WA 375 • Não precisa acessar ou retornar todas as colunas para calcular a soma de “Amount”
  • 7. Amazon Redshift reduz I/O • Banco de dados colunar • Compressão de dados • “Zone maps” • Disco local • Blocos de dados grande • Compressão por coluna reduz o uso de espaço e acelera leitura • Amazon Redshift pode fazer a escolha para você, automaticamente analyze compression listing; Table | Column | Encoding ---------+----------------+---------- listing | listid | delta listing | sellerid | delta32k listing | eventid | delta32k listing | dateid | bytedict listing | numtickets | bytedict listing | priceperticket | delta32k listing | totalprice | mostly32 listing | listtime | raw
  • 8. Amazon Redshift reduz I/O • Banco de dados colunar • Compressão de dados • “Zone maps” • Disco local • Blocos de dados grande • Cada bloco registra o valor mínimo/máximo, em memória. • Blocos que não vão satisfazer o filtro, não são lidos. • O I/O mais rápido é aquele que não precisa ser feito.
  • 9. Amazon Redshift reduz I/O • Banco de dados colunar • Compressão de dados • “Zone maps” • Disco local • Blocos de dados grande • Disco local maximiza a taxa de transferência • Hardware otimizado para processamento de informação • Bloco grande aproveita cada acesso • Amazon Redshift garante a durabilidade dos dados
  • 10. Arquitetura do Amazon Redshift • Nó Líder – SQL – Armazena meta-data – Coordena execução • Nó Computacional – Armazenamento local e colunar – Consultas executam em paralelo – Carga, Backup/Restore usa Amazon S3 – Carga em paralelo com Amazon DynamoDB • Opção de nó único disponível 10 GigE (HPC) Ingestion Backup Restore JDBC/ODBC
  • 11. Amazon Redshift usa hardware customizado HS1.8XL: 128 GB RAM, 16 Cores, 24 discos, 16 TB espaço comprimido, 2 GB/sec taxa de busca HS1.XL: 16 GB RAM, 2 Cores, 3 discos, 2 TB espaço comprimido • Otimizado para I/O intenso • Alta densidade de disco • Usa HPC – Rede de 10 Gbit/sec • HS1.8XL disponível no Amazon EC2
  • 12. Amazon Redshift = Tudo em Paralelo • Consulta • Carga de Dados • Backup/Restore • Elasticidade
  • 13. Amazon Redshift = Tudo em Paralelo • Consulta • Carga de Dados • Backup/Restore • Elasticidade • Carga em paralelo do S3 ou DynamoDB • Dados automaticamente distribuídos e ordenados de acordo com o DDL • Escala linearmente com o número de nós.
  • 14. Amazon Redshift = Tudo em Paralelo • Consulta • Carga de Dados • Backup/Restore • Elasticidade • Backups para S3 é automático, continuo e incremental • Período de retenção configurável • Copias manuais usando API e console web • “Streaming restores” possibilitam estar on-line mais rápido.
  • 15. Amazon Redshift = Tudo em Paralelo • Consulta • Carga de Dados • Backup/Restore • Elasticidade • Ampliação/redução acontece on-line (leitura) • Provisionamento invisível • Dados transferidos em paralelo por nó • Você só paga o cluster origem durante o processo.
  • 16. Amazon Redshift = Tudo em Paralelo • Consulta • Carga de Dados • Backup/Restore • Elasticidade • DNS é atualizado automaticamente • Cluster original é descartado • Operação simples usando AWS Console ou API
  • 17. Amazon Redshift permite que você comece pequeno e cresça Extra Large Node (HS1.XL) 3 spindles, 2 TB, 16 GB RAM, 2 cores Nó Único (2 TB) Cluster 2-32 Nós (4 TB – 64 TB) 8x Extra Large Node (HS1.8XL) 24 spindles, 16 TB, 128 GB RAM, 16 cores, 10 GigE Cluster 2-100 Nós (32 TB – 1.6 PB)
  • 18. Amazon Redshift : preço permite analisar todos os seus dados Preço por Hora/Nó HS1.XL Preço por Hora/TB Preço por Ano/TB On-Demand $ 0.850 $ 0.425 $ 3,723 Reserva 1 ano $ 0.500 $ 0.250 $ 2,190 Reserva 3 anos $ 0.228 $ 0.114 $ 999 Preço Simples Número de nós x Custo por hora Sem custo para o nó líder Pague pelo uso
  • 19. Amazon Redshift é fácil de usar • Provisionamento em Minutos • Monitoramento de Performance • Elasticidade simples • Segurança embutida • Backups automáticos
  • 23. Segurança embutida • SSL garante segurança de transmissão • Criptografia protege dados em repouso – AES-256; aceleração por hardware – Todos os blocos em disco e no Amazon S3 criptografados • Sem acesso direto a nós de computação • Suporta Amazon VPC 10 GigE (HPC) Ingestion Backup Restore Customer VPC Internal VPC JDBC/ODBC
  • 24. Amazon Redshift: Operação Simples • Replicação de dados em múltiplos nos e copia para S3 garante durabilidade. • Backups para Amazon S3 contínuo, automático e incremental. – Projetado para 11 noves de durabilidade • Monitoramento contínuo e recuperação automática de falhas de drives e nós • Capaz de restaurar para qualquer zona de disponibilidade (AZ) dentro de uma região
  • 25. Amazon Redshift integra com varias fontes de dados Amazon DynamoDB Amazon Elastic MapReduce Amazon Simple Storage Service (S3) Amazon Elastic Compute Cloud (EC2) AWS Storage Gateway Service Corporate Data Center Amazon Relational Database Service (RDS) Amazon Redshift Mais opções em breve …
  • 26. Amazon Redshift várias opções de carga de dados • Amazon S3 • AWS Direct Connect • AWS Import/Export • Parceiros Mais opções em breve … Data Integration Systems Integrators
  • 27. Amazon Redshift compatível com suas ferramentas JDBC/ODBC Amazon Redshift Mais opções em breve …
  • 28. Dicas Práticas para começar com Redshift • Prepare-se para adaptar seu processo ETL/ELT para tirar vantagem das características da Amazon Cloud • Reserve tempo para testar configurações diferentes – Distkey, sortkey, ,compressão – Número de nós e filas (WLM) • Use S3/Glacier para arquivamento de dados (UNLOAD) • Simule partições cronológicas com tabelas separadas e visões • Considere Carga -> Duplicação -> Consultas para situações apropriadas • De-normalize apenas para evitar JOIN onde distkey das tabelas não casa
  • 29. Mais informações - Q&A • Eric Ferreira | ericfe@amazon.com | @ericnf • http://aws.amazon.com/redshift • https://aws.amazon.com/marketplace/redshift/ • “Best Practices” – http://docs.aws.amazon.com/redshift/latest/dg/c_loading-data-best-practices.html – http://docs.aws.amazon.com/redshift/latest/dg/c_designing-tables-best-practices.html – http://docs.aws.amazon.com/redshift/latest/dg/c-optimizing-query-performance.html