SlideShare uma empresa Scribd logo
Cassandra NoSQL
  fmasanori@gmail.com
    17 de março de 2012
 slideshare.net/fmasanori
•   Eu, vocês e Java
•   Motivação
•   Big Data e NoSQL
•   Cassandra
•   Hello World: Cassandra
•   Pentaho
•   Hello World: Pentaho + Cassandra
•   Perguntas e sugestões
• Computação IME-USP e Mestrado ITA
• ed e lint Cobra Tecnologia
• Credicard Mastercard – sistema autorização
• PriceWaterhouseCoopers
• Itaú BankBoston
• Docente FATEC: algoritmos, estrutura de
  dados, data warehouse, tópicos avançados
  em bancos de dados
• Interesses: Python, Data Warehouse, NoSQL,
  Pentaho, Google Technology, Facebook
Vocês
•   Estudantes
•   Professores
•   Desenvolvedores Java
•   Sabe quem é Sang Shin
•   Sun Tech Days/ Java One
•   NoSQL
•   Cassandra
•   Pentaho
Job Trends (indeed.com)
Job Trends (indeed.com)
Big Data
Big Data
•   2720 exabytes serão criados em 2012
•   1 exabyte = 1 bilhão de gigabytes
•   Mais bytes que estrelas no universo
•   Twitter: 230M tweets/dia
•   YouTube: upload de 1 hora de vídeo/seg
•   Drowning in numbers (The Economist)
Novas arquiteturas são necessárias
Escalabilidade vertical
• Escalabilidade para leituras num banco
  relacional é trabalhoso
• Escalabilidade para escritas num banco
  relacional é virtualmente impossível
  (e caso você consiga ele deixou de ser
  relacional...)
Escalabilidade vertical
Escalabilidade horizontal
Escalabilidade horizontal
Dois artigos famosos
• Bigtable: A distributed storage system for
  structured data, 2006
• Dynamo: Amazon’s highly available key-
  value store, 2007
Apache Hadoop
Cassandra NoSQL JUG Vale 2012
Not Only SQL




Mas BDs não relacionais são antigos...
Qual o problema com bancos de
         dados relacionais?

“If I had asked people what they wanted, they
                would have said faster horses”.
                                    Henry Ford.
Escalabilidade + ACID = digestão difícil
BASE = ajuda na digestão




Basically Available Soft State Eventually Consistent
Eventually Consistent




  “Eventual” pt-br: pode não ocorrer
“Eventual” inglês: irá ocorrer em breve
Teorema CAP
• Consistency:
  – Todos os clientes enxergam os mesmos dados
  – Consistência tradicional (ACID)
  – Consistência eventual (BASE)
• Availability
• Partition tolerance
• Não mais que 2 dos 3 requisitos (E. Brewer, S.
  Gilbert, N. Lynch)
Not Only SQL
Difíceis de comparar
Cassandra NoSQL JUG Vale 2012
Cassandra:
 • Distribuído
 • Tolerante à falhas
 • Escalável
 • Orientado a colunas
Bigtable, 2006     Dynamo, 2007




Open Source, 2008




   Apache, 2009          Cassandra, 2010
Cassandra NoSQL JUG Vale 2012
Cassandra vs MySQL (50GB)

MySQL:
 ~300ms write
 ~350ms read
Cassandra:
 ~0.12ms write
 ~15ms read
Cassandra NoSQL JUG Vale 2012
Hello World
Hello World Cassandra
Download DataStax Community Edition
ou
Download Apache Cassandra

./cassandra

./cassandra-cli –h localhost –p 9160

Conflitos:
  cassandra.bat (windows)
  /etc/cassandra/cassandra-env.sh (ubuntu)
Obs.: necessário Oracle Sun Java
Hello World Cassandra
create keyspace jugvale;
use jugvale;
create column family demo;
set demo[0][0] = utf8(‘fernando’);
set demo[0][1] = utf8(‘masanori’);
get demo[0];
del demo[0];
exit;
Hello World Cassandra
• Clientes Cassandra: Java, PHP, Python, Ruby...
• CQL (Cassandra Query Language)



• Pentaho Data Integration
Cassandra NoSQL JUG Vale 2012
• Analytics no mercado mundial, Gartner:
• 2009: +3.8 %
• 2010: +13.4%

• América Latina:
• 2010: +19.5%
Operacional x Analítico
                             Operacional                  Analítico
Propósito               Executar um processo         Avaliar um processo
Estilo interação     Insert, update, delete, query    Query (read-only)
Escopo interação         Transação individual             Agregação
Padrão query             Previsível e estável            Imprevisível
Foco temporal                   Atual                  Histórico e atual
Otimização               Update concorrente           Query (agregação)
Projeto                       ER na 3FN              Star Schema ou Cubo

                                                                  (Adamson, 2010)
Banco Relacional Tradicional




                               (Timo Elliott, SAP)
Banco Colunar




                (Timo Elliott, SAP)
Hello World: Pentaho + Cassandra
Hello World: Pentaho + Cassandra
•   Gravar dados no Cassandra
•   Ler dados do Cassandra
•   Criar um relatório a partir do Cassandra
•   Vídeos curtos incluídos nos links acima
Cassandra NoSQL JUG Vale 2012
Cassandra NoSQL JUG Vale 2012
Créditos
• Jonathan Ellis (DataStax), vários slides
• Timo Elliott (SAP), tetris colunar
• ADAMSON, C., Star Schema, The Complete
  Reference, McGrawHill, 2010.
Outros tópicos
• NewSQL
• The End of an Architectural Era, M.
  Stonebraker et al., VLDB 2007
• Polyglot Persistence (Martin Fowler)
Perguntas ou sugestões?
   fmasanori@gmail.com
  facebook.com/fmasanori
   twitter.com/fmasanori

Mais conteúdo relacionado

PDF
PPTX
Introdução ao NoSQL e modelagem de dados com MongoDB
PPTX
Sem limites com NoSQL
PPTX
Criando sistemas de recomendação com Neo4j
PPTX
[MinhaVida TechDay] NoSQL
PPTX
Graph of Thrones - Neo4j + Game of Thrones
PDF
PPTX
Persistência Poliglota: Indo além do SQL
Introdução ao NoSQL e modelagem de dados com MongoDB
Sem limites com NoSQL
Criando sistemas de recomendação com Neo4j
[MinhaVida TechDay] NoSQL
Graph of Thrones - Neo4j + Game of Thrones
Persistência Poliglota: Indo além do SQL

Mais procurados (17)

ODP
Persistência Poliglota, Big Data e NoSQL FISL 15
PPTX
NOSQL uma breve introdução
PPTX
Estudo comparativo entr bancos RDBMS, NoSQL e NewSQL
PDF
Introdução ao NoSql
PDF
Escalabilidade, as modas, (No)SQL
PPT
Bancos de dados NoSQL (Not only sql)
PPTX
Banco de dados nas nuvens - aula 2
PPTX
Banco de dados nas nuvens - aula 1
PPTX
Banco de dados nas nuvens - aula 3
PDF
Bancos de dados nosql (not only sql)
PPTX
Tirando leite de pedra
PPTX
Modelos NoSQL e a Persistência Poliglota
PPT
2012 - Veris - DBA Career and Oracle Database
PPTX
Performance Codificando Night Week 2016
PPTX
Introdução no sql mongodb java
PDF
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
PDF
Bancos de dados NoSQL
Persistência Poliglota, Big Data e NoSQL FISL 15
NOSQL uma breve introdução
Estudo comparativo entr bancos RDBMS, NoSQL e NewSQL
Introdução ao NoSql
Escalabilidade, as modas, (No)SQL
Bancos de dados NoSQL (Not only sql)
Banco de dados nas nuvens - aula 2
Banco de dados nas nuvens - aula 1
Banco de dados nas nuvens - aula 3
Bancos de dados nosql (not only sql)
Tirando leite de pedra
Modelos NoSQL e a Persistência Poliglota
2012 - Veris - DBA Career and Oracle Database
Performance Codificando Night Week 2016
Introdução no sql mongodb java
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Bancos de dados NoSQL
Anúncio

Semelhante a Cassandra NoSQL JUG Vale 2012 (20)

PDF
Web Scale Data Management
PDF
MAC5855 - NoSQL
ODP
Processos iniciais do mapeamento OR
PPTX
NoSQL, Base VS ACID e Teorema CAP
KEY
Projeto Octopus - Database Sharding para ActiveRecord
PDF
Bigadata casese opotunidades
PDF
Escalando para os primeiros 10 milhoes de usuarios
PDF
NoSQL: Perdas e Ganhos
PDF
Inovacao em-escala-final
PDF
NoSQL Livre
PDF
Artigo Nosql
PDF
Pepe Legal Python e Babalu MongoDB, uma dupla dinâmica
PDF
Benchmark LucidDB x MySQL para aplicações de Business Intelligence
PPTX
Webinar: Introdução a Big data
PDF
MySQL do ISAM ao NoSQL
PPT
I nd t_bigdata(1)
PDF
Internet sem drama
PPS
Apresentação
PDF
MySQL no Windows: implementação eficiente de novas aplicações
PPTX
No sql Orientado a documento
Web Scale Data Management
MAC5855 - NoSQL
Processos iniciais do mapeamento OR
NoSQL, Base VS ACID e Teorema CAP
Projeto Octopus - Database Sharding para ActiveRecord
Bigadata casese opotunidades
Escalando para os primeiros 10 milhoes de usuarios
NoSQL: Perdas e Ganhos
Inovacao em-escala-final
NoSQL Livre
Artigo Nosql
Pepe Legal Python e Babalu MongoDB, uma dupla dinâmica
Benchmark LucidDB x MySQL para aplicações de Business Intelligence
Webinar: Introdução a Big data
MySQL do ISAM ao NoSQL
I nd t_bigdata(1)
Internet sem drama
Apresentação
MySQL no Windows: implementação eficiente de novas aplicações
No sql Orientado a documento
Anúncio

Mais de FATEC São José dos Campos (20)

PDF
Seja feliz programando em python
PDF
import pybr12: experiencias de inclusión en la última PyCon Brazil
PDF
Import community pycon jp
PDF
Import community
PDF
Diversidade na Comunidade Python
PDF
Hackeando Dados públicos com python
PDF
Import community
PDF
Python, the next Brazilian generation
PDF
Para gostar de Python DevDay
PDF
Classic Games with Python in the browser
PDF
Exercício Programa 1 Python para Zumbis
PDF
Lista de exercícios V python para zumbis
PDF
Lista de exercícios IV python para zumbis
PDF
Lista de exercícios III Desafios python para zumbis
PDF
Lista de exercícios II python para zumbis
PDF
Lista de exercícios I python para zumbis
PDF
Lista de exercícios XIV Python para Zumbis
PDF
PDF
TWP54 Exceções
Seja feliz programando em python
import pybr12: experiencias de inclusión en la última PyCon Brazil
Import community pycon jp
Import community
Diversidade na Comunidade Python
Hackeando Dados públicos com python
Import community
Python, the next Brazilian generation
Para gostar de Python DevDay
Classic Games with Python in the browser
Exercício Programa 1 Python para Zumbis
Lista de exercícios V python para zumbis
Lista de exercícios IV python para zumbis
Lista de exercícios III Desafios python para zumbis
Lista de exercícios II python para zumbis
Lista de exercícios I python para zumbis
Lista de exercícios XIV Python para Zumbis
TWP54 Exceções

Último (20)

PDF
Historia-da-Psicologia-Rumos-e-percursos.pdf
PPTX
Fronteiras e soberania..........................pptx
PPT
Aula de Sociologia 22022022154507AULA 2.ppt
PPTX
2. A Cultura do Salão - o fim das trevas.pptx
PPT
YY2015MM3DD6HH12MM42SS3-Organiza__o do Estado ILP.ppt
PPTX
Slides Lição 8, Betel, Jesus e a Mulher Adúltera, 3Tr25.pptx
PDF
morfologia5.pdfllllllllllllllllllllllllllll
PPTX
BIÓTICOS E ABIOTICOS CADEIA ALIMENTAR.pptx
PPTX
AULA 01 - INTRODUÇÃO AO ATENDIMENTO HUMANIZADO.pptx
PDF
Urbanização no Brasil LEVANDO EM CONTA CONCEITOS
PDF
Pecados desdenhados por muita gente (islamismo)
PDF
cadernodoprofessor20142017vol2baixalceducfisicaef6s7a-170409213016.pdf manual...
PPTX
matriaesuastransformaes-1ano-230402203238-f3b10049.pptx
PPTX
1. A Cultura do Palco - muitos palcos, um espetáculo.pptx
PDF
01-slide-especialidade-mensageira-de-deus.pdf
PPTX
Slides Lição 8, CPAD, Uma Igreja que Enfrenta os seus Problemas, 3Tr25.pptx
PDF
Fiqh da adoração (islamismo)
PPTX
4. A cultura do cinema e as vanguardas.pptx
PDF
historia-e-geografia-do-amapa.pdf slides
DOCX
PLANEJAMENTO QUINZENAL - 18.08.2025 à 29.08.2025 - 2ºANO - PROFESSORA PATRÍCI...
Historia-da-Psicologia-Rumos-e-percursos.pdf
Fronteiras e soberania..........................pptx
Aula de Sociologia 22022022154507AULA 2.ppt
2. A Cultura do Salão - o fim das trevas.pptx
YY2015MM3DD6HH12MM42SS3-Organiza__o do Estado ILP.ppt
Slides Lição 8, Betel, Jesus e a Mulher Adúltera, 3Tr25.pptx
morfologia5.pdfllllllllllllllllllllllllllll
BIÓTICOS E ABIOTICOS CADEIA ALIMENTAR.pptx
AULA 01 - INTRODUÇÃO AO ATENDIMENTO HUMANIZADO.pptx
Urbanização no Brasil LEVANDO EM CONTA CONCEITOS
Pecados desdenhados por muita gente (islamismo)
cadernodoprofessor20142017vol2baixalceducfisicaef6s7a-170409213016.pdf manual...
matriaesuastransformaes-1ano-230402203238-f3b10049.pptx
1. A Cultura do Palco - muitos palcos, um espetáculo.pptx
01-slide-especialidade-mensageira-de-deus.pdf
Slides Lição 8, CPAD, Uma Igreja que Enfrenta os seus Problemas, 3Tr25.pptx
Fiqh da adoração (islamismo)
4. A cultura do cinema e as vanguardas.pptx
historia-e-geografia-do-amapa.pdf slides
PLANEJAMENTO QUINZENAL - 18.08.2025 à 29.08.2025 - 2ºANO - PROFESSORA PATRÍCI...

Cassandra NoSQL JUG Vale 2012

  • 1. Cassandra NoSQL fmasanori@gmail.com 17 de março de 2012 slideshare.net/fmasanori
  • 2. Eu, vocês e Java • Motivação • Big Data e NoSQL • Cassandra • Hello World: Cassandra • Pentaho • Hello World: Pentaho + Cassandra • Perguntas e sugestões
  • 3. • Computação IME-USP e Mestrado ITA • ed e lint Cobra Tecnologia • Credicard Mastercard – sistema autorização • PriceWaterhouseCoopers • Itaú BankBoston • Docente FATEC: algoritmos, estrutura de dados, data warehouse, tópicos avançados em bancos de dados • Interesses: Python, Data Warehouse, NoSQL, Pentaho, Google Technology, Facebook
  • 4. Vocês • Estudantes • Professores • Desenvolvedores Java • Sabe quem é Sang Shin • Sun Tech Days/ Java One • NoSQL • Cassandra • Pentaho
  • 8. Big Data • 2720 exabytes serão criados em 2012 • 1 exabyte = 1 bilhão de gigabytes • Mais bytes que estrelas no universo • Twitter: 230M tweets/dia • YouTube: upload de 1 hora de vídeo/seg • Drowning in numbers (The Economist)
  • 9. Novas arquiteturas são necessárias
  • 10. Escalabilidade vertical • Escalabilidade para leituras num banco relacional é trabalhoso • Escalabilidade para escritas num banco relacional é virtualmente impossível (e caso você consiga ele deixou de ser relacional...)
  • 14. Dois artigos famosos • Bigtable: A distributed storage system for structured data, 2006 • Dynamo: Amazon’s highly available key- value store, 2007
  • 17. Not Only SQL Mas BDs não relacionais são antigos...
  • 18. Qual o problema com bancos de dados relacionais? “If I had asked people what they wanted, they would have said faster horses”. Henry Ford.
  • 19. Escalabilidade + ACID = digestão difícil
  • 20. BASE = ajuda na digestão Basically Available Soft State Eventually Consistent
  • 21. Eventually Consistent “Eventual” pt-br: pode não ocorrer “Eventual” inglês: irá ocorrer em breve
  • 22. Teorema CAP • Consistency: – Todos os clientes enxergam os mesmos dados – Consistência tradicional (ACID) – Consistência eventual (BASE) • Availability • Partition tolerance • Não mais que 2 dos 3 requisitos (E. Brewer, S. Gilbert, N. Lynch)
  • 26. Cassandra: • Distribuído • Tolerante à falhas • Escalável • Orientado a colunas
  • 27. Bigtable, 2006 Dynamo, 2007 Open Source, 2008 Apache, 2009 Cassandra, 2010
  • 29. Cassandra vs MySQL (50GB) MySQL: ~300ms write ~350ms read Cassandra: ~0.12ms write ~15ms read
  • 32. Hello World Cassandra Download DataStax Community Edition ou Download Apache Cassandra ./cassandra ./cassandra-cli –h localhost –p 9160 Conflitos: cassandra.bat (windows) /etc/cassandra/cassandra-env.sh (ubuntu) Obs.: necessário Oracle Sun Java
  • 33. Hello World Cassandra create keyspace jugvale; use jugvale; create column family demo; set demo[0][0] = utf8(‘fernando’); set demo[0][1] = utf8(‘masanori’); get demo[0]; del demo[0]; exit;
  • 34. Hello World Cassandra • Clientes Cassandra: Java, PHP, Python, Ruby... • CQL (Cassandra Query Language) • Pentaho Data Integration
  • 36. • Analytics no mercado mundial, Gartner: • 2009: +3.8 % • 2010: +13.4% • América Latina: • 2010: +19.5%
  • 37. Operacional x Analítico Operacional Analítico Propósito Executar um processo Avaliar um processo Estilo interação Insert, update, delete, query Query (read-only) Escopo interação Transação individual Agregação Padrão query Previsível e estável Imprevisível Foco temporal Atual Histórico e atual Otimização Update concorrente Query (agregação) Projeto ER na 3FN Star Schema ou Cubo (Adamson, 2010)
  • 38. Banco Relacional Tradicional (Timo Elliott, SAP)
  • 39. Banco Colunar (Timo Elliott, SAP)
  • 40. Hello World: Pentaho + Cassandra
  • 41. Hello World: Pentaho + Cassandra • Gravar dados no Cassandra • Ler dados do Cassandra • Criar um relatório a partir do Cassandra • Vídeos curtos incluídos nos links acima
  • 44. Créditos • Jonathan Ellis (DataStax), vários slides • Timo Elliott (SAP), tetris colunar • ADAMSON, C., Star Schema, The Complete Reference, McGrawHill, 2010.
  • 45. Outros tópicos • NewSQL • The End of an Architectural Era, M. Stonebraker et al., VLDB 2007 • Polyglot Persistence (Martin Fowler)
  • 46. Perguntas ou sugestões? fmasanori@gmail.com facebook.com/fmasanori twitter.com/fmasanori