SlideShare uma empresa Scribd logo
Big Data na prática
Resolvendo problemas de performance com Hadoop
Marco Reis
http://marcoreis.net
@masreis
Agenda
● Modelo tradicional de desenvolvimento
● Desafios e oportunidades do big data
● Hadoop
– HDFS
– MapReduce
– Ecossistema
● Arquitetura de soluç ões com Hadoop
Quem
● Marco Reis
– Arquitetura de software
– Java EE
– Sistemas de busca
– Big data
A histó ria
● Estamos sempre envolvidos em projetos de
sistemas
– Abordagem tradicional de desenvolvimento
● “Big data é para grandes projetos”
● “Big data é para inteligência artificial”
● “Não é para mim”
O modelo tradicional
● Linguagem de alto nível (Java/.NET/Ruby)
● Banco de dados relacionais
● Padronização
– Padrões de projeto de software
– SQL ANSI
– Servidor de aplicação
– Maturidade (décadas de evolução)
Um dia...
● O sistema escala
– Versão web
– Versão mobile
Bigdata na pratica: Resolvendo problemas de performance com hadoop
E descobrimos as limitaç ões
● Processamento
– Mais processamento = mais hardware
● Input/Output
– IO de alta performance é caro
● Tempo de resposta inaceitável
– Relató rios semanais
● Custo (Hardware e software)
– Adquirir mais máquinas?
Chega o big data
● Implementaç ão mais conhecida: Hadoop
● Complementaç ão do modelo tradicional
– Não substituiç ão
● Pode ser integrado com outras ferramentas
– Driver para banco de dados relacional
– API Java
– RESTful web services
Big data
● Um termo novo para um problema antigo
● Processamento de grande volume de dados
● Alternativa ao modelo tradicional
– Escala (terabytes / petabytes / exabytes)
– Velocidade (rede social, logs, integraç ão)
– Complexidade (dados estruturados, semi-
estruturados e não estruturados)
● Não existe uma definiç ão formal para Big Data
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Quem precisa de Big Data?
● A demanda jáexiste e talvez vocênão tenha
percebido
– Processamento em lote
– Relató rios
– ETL
– Melhoria de performance
● Podemos oferecer novas funcionalidades para o
cliente
● Ou simplesmente por curiosidade!
Usos avanç ados
● NLP (Natural Language Processing)
● Mobilidade urbana
● IoT (Internet of Things)
– 50 bilhões de dispositivos (sensores) conectados
em 2025
● Data as a Service e Big Data as a Service
Fonte: Smart Steps (Telefonica)
Eliminaç ão dos limites
● Facilidade para criar contextos
– Os modelos não precisam estar definidos a priori
– Criaç ão de modelos por demanda
– Armazene tudo
– Depois descubra como extrair valor
Questões éticas e legais
● Big data não é sobre números.
● Big data é sobre pessoas!!!
– Privacidade
– Críticas
– Comparaç ões
Hadoop
● Software para computaç ão distribuída de alta
performance
– Tolerância a falhas / Redundância
– Cluster / processamento paralelo
● Hardware de baixo custo (processador e disco)
– Diferente de hardware de baixa qualidade
● Implementaç ão mais popular para big data
● Linearmente escalável
Hadoop = HDFS + MapReduce
● HDFS: Sistema de arquivos distribuído de alta
performance
● MapReduce: modelo de programaç ão
distribuída
● Moving Computation is Cheaper than Moving
Data
Hadoop é bom para...
● Processamento em lote
– Só isso járesolve muitos problemas
● Armazenamento
● Data warehouse (queries e reports)
● Reduç ão de custos
Usos imediatos do Hadoop
● Consolidaç ão / agregaç ão de dados
● Armazenamento
● Análise: log / estatística
● ETL
● Georreferenciamento
O Hadoop resolve tudo?
Alguns desafios do Hadoop
● Processamento de baixa latência ou busca de
registros individuais
– Use um banco NoSQL (HBase)
● Data warehouse
– Use o Hive
● Processamento com datasets pequenos
– O custo de implementaç ão é alto
● Sua aplicaç ão precisa mesmo ser
completamente transacional e em tempo real?
Tecnicamente falando
● Especializar os serviç os de dados
– SGBDR - serviç os em tempo real (transacionais)
– Hadoop - serviç os assíncronos
● Evitar concorrência entre os serviç os
– Alguns sistemas acessam o SGBDR
– Outros acessam o Hadoop
Ecossistema Hadoop
● Projetos paralelos e complementares
● Para cada problema, uma soluç ão
– Problemas específicos demandam ferramentas
específicas
Ferramentas
● Juntar todas essas peças é um exercício de
criatividade
Sqoop
● Importaç ão e exportaç ão de dados entre
Hadoop e bancos relacionais
● Exemplo: scripts rodando com frequência
determinada
– 10 minutos
– 1 hora
– 12 horas
HBase
● Banco de dados NoSQL
– Baixa latência
● Orientado a coluna
– Suporta bilhões de colunas
● A modelagem não é trivial (multidimensional)
– Chave, família da coluna, qualificador e valor
● Não é substituto do banco relacional
Hive
● Data warehouse
● Consultas usando padrão SQL (HiveQL)
● Sumarizaç ão simplificada
Pig
● Plataforma para análise de dados com
linguagem de alto nível
● Produz uma sequência de programas
MapReduce
Oozie
● Workflow para processamento Hadoop
● Indica a ordem em que os jobs devem rodar
● Suporta diversas aç ões:
– Copiar arquivos para o HDFS
– Iniciar os jobs MapReduce
– Importar/exportar dados com o Sqoop
Cenário 1: processamento em lote
● Importar os dados (Sqoop/HDFS)
● Processar os dados com MapReduce
● Exportar o resultado processado (reduzido)
para o banco relacional
● Consequência: alívio do servidor de aplicaç ão e
banco de dados, sem mudar o có digo da
aplicaç ão
Cenário 2: alternar fontes de dados
● Problema: lentidão em um mó dulo do sistema
● Exportar dados do relacional
● Alterar uma parte não transacional da aplicaç ão
para acessar os dados do HBase
● Vantagem: baixa latência, a aplicaç ão fica mais
rápida
● Desvantagem: aumenta complexidade
Cenário 3: ETL
● Importaç ão de dados de várias fontes
(relacional/HDFS/HBase/Hive)
● Transformaç ão (enriquecimento) dos dados
– MapReduce ou Pig
● Carregar os dados no destino
Cenário 4: data warehouse
● Útil quando consideramos grandes data sets
● A latência é aceitável
● Disponível para usuários especializados
Concluindo
● Outras ferramentas fazem a mesma coisa
● Não existe uma solução perfeita para os
problemas
– Muitas combinações diferentes
● Podemos integrar o Hadoop com uma
aplicação já existente
Marco Reis
http://marcoreis.net
@masreis

Mais conteúdo relacionado

PDF
Treinamento hadoop - dia4
PDF
Treinamento Hadoop - dia2
PDF
Treinamento hadoop - dia3
PDF
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
PDF
Treinamento hadoop - dia1
PDF
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
PDF
TDC 2014 - Hadoop Hands ON
PPT
BIGDATA: Da teoria à Pratica
Treinamento hadoop - dia4
Treinamento Hadoop - dia2
Treinamento hadoop - dia3
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Treinamento hadoop - dia1
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
TDC 2014 - Hadoop Hands ON
BIGDATA: Da teoria à Pratica

Mais procurados (20)

PPTX
Arquitetura para solução Big Data – open source
PDF
Hadoop - Primeiros passos
ODP
Seminário Hadoop
PPTX
Hadoop - Mãos à massa! Qcon2014
ODP
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
PDF
Big Data - O que é o hadoop, map reduce, hdfs e hive
PPTX
Proposta de arquitetura Hadoop
PDF
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
PDF
Data Lakes com Hadoop e Spark: Agile Analytics na prática
PDF
Arquiteturas, Tecnologias e Desafios para Análise de BigData
PDF
Hadoop, Big Data e Cloud Computing
PDF
Cientista de Dados – Dominando o Big Data com Software Livre
PDF
Big Data Open Source com Hadoop
PDF
Pentaho, Hadoop , Big Data e Data Lakes
PDF
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
PDF
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PDF
Arquitetura do Framework Apache Hadoop 2.6
PDF
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
PDF
TDC2017 - Misturando dados com Pentaho para insights mais significativos
Arquitetura para solução Big Data – open source
Hadoop - Primeiros passos
Seminário Hadoop
Hadoop - Mãos à massa! Qcon2014
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Big Data - O que é o hadoop, map reduce, hdfs e hive
Proposta de arquitetura Hadoop
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Arquiteturas, Tecnologias e Desafios para Análise de BigData
Hadoop, Big Data e Cloud Computing
Cientista de Dados – Dominando o Big Data com Software Livre
Big Data Open Source com Hadoop
Pentaho, Hadoop , Big Data e Data Lakes
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
Arquitetura do Framework Apache Hadoop 2.6
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
TDC2017 - Misturando dados com Pentaho para insights mais significativos
Anúncio

Semelhante a Bigdata na pratica: Resolvendo problemas de performance com hadoop (20)

PPTX
Big data e ecossistema hadoop
PDF
Qcon Rio 2015 - Data Lakes Workshop
PDF
Big data para programadores convencionais
PDF
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
PDF
Interoperabilidade com BigData Hadoop para Windows Azure
PPTX
Big Data, JVM e Redes Sociais
PDF
Ferramentas e Aplicações em Big Data
PDF
Bigdata - compreendendo Hadoop e seu ecossistema.
PPTX
Hadoop - primeiros passos
PDF
Pentaho Hadoop Big Data e Data Lakes
PPTX
PDF
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
PPTX
BrunoSQLSaturday424
PPSX
Sparsi big data
PDF
Modelos de computação distribuída no Hadoop
PDF
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
PDF
PDF
Tecnologias para mineração de dados nas nuvens
Big data e ecossistema hadoop
Qcon Rio 2015 - Data Lakes Workshop
Big data para programadores convencionais
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
Interoperabilidade com BigData Hadoop para Windows Azure
Big Data, JVM e Redes Sociais
Ferramentas e Aplicações em Big Data
Bigdata - compreendendo Hadoop e seu ecossistema.
Hadoop - primeiros passos
Pentaho Hadoop Big Data e Data Lakes
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
BrunoSQLSaturday424
Sparsi big data
Modelos de computação distribuída no Hadoop
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Tecnologias para mineração de dados nas nuvens
Anúncio

Mais de tdc-globalcode (20)

PDF
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
PDF
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
PDF
TDC2019 Intel Software Day - ACATE - Cases de Sucesso
PDF
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
PDF
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
PDF
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
PDF
TDC2019 Intel Software Day - Inferencia de IA em edge devices
PDF
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
PPT
Trilha .Net - Programacao funcional usando f#
PDF
TDC2018SP | Trilha Go - Case Easylocus
PDF
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
PDF
TDC2018SP | Trilha Go - Clean architecture em Golang
PDF
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
PDF
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
PDF
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
PDF
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
PDF
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
PDF
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
PDF
TDC2018SP | Trilha .Net - .NET funcional com F#
PDF
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Core
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
TDC2019 Intel Software Day - ACATE - Cases de Sucesso
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
TDC2019 Intel Software Day - Inferencia de IA em edge devices
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
Trilha .Net - Programacao funcional usando f#
TDC2018SP | Trilha Go - Case Easylocus
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
TDC2018SP | Trilha Go - Clean architecture em Golang
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
TDC2018SP | Trilha .Net - .NET funcional com F#
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Core

Último (20)

PPTX
Trabalho Cidades sustentáveis ou Utopia.pptx
PPTX
INDÚSTRIA_ Histórico da industrialização.pptx
PDF
embriologia_animal_aula_share_2026_semestre
PDF
aulademeiodetransporteemlibras-120304202807-phpapp01_removed.pdf
PPTX
Biologia celular: citologia, é o estudo da célula, a unidade básica da vida.
PPTX
Realismo e Naturalismo: Aluísio Azevedo.
PDF
O retorno a origem (islã Islamismo)
PPTX
ACIDOS NUCLEICOS - REPLICAÇÃO DO DNA - E.M.
PPT
Imperio Bbrasileiro-1822-1889 - aspectos gerais
PDF
Ebook - Matemática_Ensino_Médio_Saeb_V1.pdf
PPTX
Reino Monera e Protista: representantes e caracteristicas.pptx
PPTX
HISTÓRIA DO BRASIL - anos de Democracia.pptx
PDF
Ementa 2 semestre PEI Orientação de estudo
PPTX
brasilcolnia2-101027184359-phpapp02.pptx
PPT
HISTOLOGIA VEGETAL - tecidos vegetais.ppt
PDF
Cantores.pdf-Deslandes, Tinoco e Zambujo
PPT
História e Evolução dos Computadores domésticos
PDF
ESPELHOS DA ALMA A PSICOLOGIA POR TRÁS DOS CONTOS DE FADAS.pdf
PDF
Metabolismo_energético_3ano_pre_vest_2026.pdf
PDF
manual-orientacao-asb_5a8d6d8d87160aa636f63a5d0.pdf
Trabalho Cidades sustentáveis ou Utopia.pptx
INDÚSTRIA_ Histórico da industrialização.pptx
embriologia_animal_aula_share_2026_semestre
aulademeiodetransporteemlibras-120304202807-phpapp01_removed.pdf
Biologia celular: citologia, é o estudo da célula, a unidade básica da vida.
Realismo e Naturalismo: Aluísio Azevedo.
O retorno a origem (islã Islamismo)
ACIDOS NUCLEICOS - REPLICAÇÃO DO DNA - E.M.
Imperio Bbrasileiro-1822-1889 - aspectos gerais
Ebook - Matemática_Ensino_Médio_Saeb_V1.pdf
Reino Monera e Protista: representantes e caracteristicas.pptx
HISTÓRIA DO BRASIL - anos de Democracia.pptx
Ementa 2 semestre PEI Orientação de estudo
brasilcolnia2-101027184359-phpapp02.pptx
HISTOLOGIA VEGETAL - tecidos vegetais.ppt
Cantores.pdf-Deslandes, Tinoco e Zambujo
História e Evolução dos Computadores domésticos
ESPELHOS DA ALMA A PSICOLOGIA POR TRÁS DOS CONTOS DE FADAS.pdf
Metabolismo_energético_3ano_pre_vest_2026.pdf
manual-orientacao-asb_5a8d6d8d87160aa636f63a5d0.pdf

Bigdata na pratica: Resolvendo problemas de performance com hadoop

  • 1. Big Data na prática Resolvendo problemas de performance com Hadoop Marco Reis http://marcoreis.net @masreis
  • 2. Agenda ● Modelo tradicional de desenvolvimento ● Desafios e oportunidades do big data ● Hadoop – HDFS – MapReduce – Ecossistema ● Arquitetura de soluç ões com Hadoop
  • 3. Quem ● Marco Reis – Arquitetura de software – Java EE – Sistemas de busca – Big data
  • 4. A histó ria ● Estamos sempre envolvidos em projetos de sistemas – Abordagem tradicional de desenvolvimento ● “Big data é para grandes projetos” ● “Big data é para inteligência artificial” ● “Não é para mim”
  • 5. O modelo tradicional ● Linguagem de alto nível (Java/.NET/Ruby) ● Banco de dados relacionais ● Padronização – Padrões de projeto de software – SQL ANSI – Servidor de aplicação – Maturidade (décadas de evolução)
  • 6. Um dia... ● O sistema escala – Versão web – Versão mobile
  • 8. E descobrimos as limitaç ões ● Processamento – Mais processamento = mais hardware ● Input/Output – IO de alta performance é caro ● Tempo de resposta inaceitável – Relató rios semanais ● Custo (Hardware e software) – Adquirir mais máquinas?
  • 9. Chega o big data ● Implementaç ão mais conhecida: Hadoop ● Complementaç ão do modelo tradicional – Não substituiç ão ● Pode ser integrado com outras ferramentas – Driver para banco de dados relacional – API Java – RESTful web services
  • 10. Big data ● Um termo novo para um problema antigo ● Processamento de grande volume de dados ● Alternativa ao modelo tradicional – Escala (terabytes / petabytes / exabytes) – Velocidade (rede social, logs, integraç ão) – Complexidade (dados estruturados, semi- estruturados e não estruturados) ● Não existe uma definiç ão formal para Big Data
  • 12. Quem precisa de Big Data? ● A demanda jáexiste e talvez vocênão tenha percebido – Processamento em lote – Relató rios – ETL – Melhoria de performance ● Podemos oferecer novas funcionalidades para o cliente ● Ou simplesmente por curiosidade!
  • 13. Usos avanç ados ● NLP (Natural Language Processing) ● Mobilidade urbana ● IoT (Internet of Things) – 50 bilhões de dispositivos (sensores) conectados em 2025 ● Data as a Service e Big Data as a Service
  • 14. Fonte: Smart Steps (Telefonica)
  • 15. Eliminaç ão dos limites ● Facilidade para criar contextos – Os modelos não precisam estar definidos a priori – Criaç ão de modelos por demanda – Armazene tudo – Depois descubra como extrair valor
  • 16. Questões éticas e legais ● Big data não é sobre números. ● Big data é sobre pessoas!!! – Privacidade – Críticas – Comparaç ões
  • 17. Hadoop ● Software para computaç ão distribuída de alta performance – Tolerância a falhas / Redundância – Cluster / processamento paralelo ● Hardware de baixo custo (processador e disco) – Diferente de hardware de baixa qualidade ● Implementaç ão mais popular para big data ● Linearmente escalável
  • 18. Hadoop = HDFS + MapReduce ● HDFS: Sistema de arquivos distribuído de alta performance ● MapReduce: modelo de programaç ão distribuída ● Moving Computation is Cheaper than Moving Data
  • 19. Hadoop é bom para... ● Processamento em lote – Só isso járesolve muitos problemas ● Armazenamento ● Data warehouse (queries e reports) ● Reduç ão de custos
  • 20. Usos imediatos do Hadoop ● Consolidaç ão / agregaç ão de dados ● Armazenamento ● Análise: log / estatística ● ETL ● Georreferenciamento
  • 22. Alguns desafios do Hadoop ● Processamento de baixa latência ou busca de registros individuais – Use um banco NoSQL (HBase) ● Data warehouse – Use o Hive ● Processamento com datasets pequenos – O custo de implementaç ão é alto ● Sua aplicaç ão precisa mesmo ser completamente transacional e em tempo real?
  • 23. Tecnicamente falando ● Especializar os serviç os de dados – SGBDR - serviç os em tempo real (transacionais) – Hadoop - serviç os assíncronos ● Evitar concorrência entre os serviç os – Alguns sistemas acessam o SGBDR – Outros acessam o Hadoop
  • 24. Ecossistema Hadoop ● Projetos paralelos e complementares ● Para cada problema, uma soluç ão – Problemas específicos demandam ferramentas específicas
  • 25. Ferramentas ● Juntar todas essas peças é um exercício de criatividade
  • 26. Sqoop ● Importaç ão e exportaç ão de dados entre Hadoop e bancos relacionais ● Exemplo: scripts rodando com frequência determinada – 10 minutos – 1 hora – 12 horas
  • 27. HBase ● Banco de dados NoSQL – Baixa latência ● Orientado a coluna – Suporta bilhões de colunas ● A modelagem não é trivial (multidimensional) – Chave, família da coluna, qualificador e valor ● Não é substituto do banco relacional
  • 28. Hive ● Data warehouse ● Consultas usando padrão SQL (HiveQL) ● Sumarizaç ão simplificada
  • 29. Pig ● Plataforma para análise de dados com linguagem de alto nível ● Produz uma sequência de programas MapReduce
  • 30. Oozie ● Workflow para processamento Hadoop ● Indica a ordem em que os jobs devem rodar ● Suporta diversas aç ões: – Copiar arquivos para o HDFS – Iniciar os jobs MapReduce – Importar/exportar dados com o Sqoop
  • 31. Cenário 1: processamento em lote ● Importar os dados (Sqoop/HDFS) ● Processar os dados com MapReduce ● Exportar o resultado processado (reduzido) para o banco relacional ● Consequência: alívio do servidor de aplicaç ão e banco de dados, sem mudar o có digo da aplicaç ão
  • 32. Cenário 2: alternar fontes de dados ● Problema: lentidão em um mó dulo do sistema ● Exportar dados do relacional ● Alterar uma parte não transacional da aplicaç ão para acessar os dados do HBase ● Vantagem: baixa latência, a aplicaç ão fica mais rápida ● Desvantagem: aumenta complexidade
  • 33. Cenário 3: ETL ● Importaç ão de dados de várias fontes (relacional/HDFS/HBase/Hive) ● Transformaç ão (enriquecimento) dos dados – MapReduce ou Pig ● Carregar os dados no destino
  • 34. Cenário 4: data warehouse ● Útil quando consideramos grandes data sets ● A latência é aceitável ● Disponível para usuários especializados
  • 35. Concluindo ● Outras ferramentas fazem a mesma coisa ● Não existe uma solução perfeita para os problemas – Muitas combinações diferentes ● Podemos integrar o Hadoop com uma aplicação já existente