SlideShare uma empresa Scribd logo
4
Mais lidos
6
Mais lidos
10
Mais lidos
Introdução ao
Apache Hadoop
Quem sou eu?
Vinícius Aires Barros
Ciência da Computação 2016 - UFT
Mestrando em Ciência da Computação - ICMC USP
Laboratório de Sistemas Distribuídos e Programação
Concorrente - LaSDPC
Áreas de Interesse: IoT, Distributed Systems, Big Data (...)
Github: @v4ires
Website: http://viniciusaires.me
Contexto
● Big Data (5V’s)
○ Volume
○ Variedade
○ Velocidade
○ Veracidade
○ Valor
● Internet das Coisas (IoT)
● Grandes Volumes de
Dados
● Programação Distribuída
e Paralela
● Dados Estruturados, Não
Estruturados e
Semiestruturados
● Bancos de Dados SQL e
NoSQL
● MapReduce
● Apache Hadoop
Mas Afinal de Contas o
que é Hadoop?
O Apache Hadoop é um software de código aberto
mantido pela Apache Foundation que tem como
propósito fornecer uma implementação livre do
modelo de programação MapReduce.
Características
❏ Linguagem Java
❏ Arquitetura Mestre Escravo (Master/Slave)
❏ Modelo de Programação MapReduce
❏ Hadoop Distributed File System (HDFS)
❏ Memória Secundária (Disco)
❏ Processamento Distribuído
❏ Escalável
❏ Tolerante a Falhas
O que não é?
❏ Linguagem de Programação
❏ Biblioteca de Machine Learning
❏ Processamento em Tempo Real
❏ Solução Definitiva para Tudo
❏ Hadoop ≠ Spark
Timeline
Nutch Hadoop
(Nutch sub-project)
Hadoop
2.9.0
2002
MapReduce
2003
Google File
System (GFS)
2004 2006 2017
Hadoop 2.2
2010
Quem utiliza?
Hadoop Zoo
Single Node
Getting Started
Multi Node
Documentação Oficial: http://hadoop.apache.org/
CMD’s Básicos
Literatura Básica
Arquitetura
Hadoop Distributed File System (HDFS)
MapReduce
Exemplo (Word Count)
Let’s Coding
https://gist.github.com/v4ires/b4b733d5a76e093265ca553269a50abe
Hadoop Streaming
● Suporte a outras Linguagens de Programação;
● Ex: Python, Ruby, JavaScript, C#, outras;
● Qualquer Linguagem de Programação com
stdin e stdout.
Links úteis
❏ http://hadoop.apache.org/
❏ http://viniciusaires.me/blog/
❏ https://www.casadocodigo.com.br/products
/livro-big-data
❏ https://www.amazon.com.br/Hadoop-Defini
tive-Guide-Tom-White/dp/1449311520
Obrigado!
Dúvidas?
Contatos:
✘ Twitter: @v4ires
✘ E-mail: v4ires@gmail.com

Mais conteúdo relacionado

PDF
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
PDF
A importância do ecossistema Java em aplicações baseadas em Big Data
PPT
NoSQL & SQL
PDF
Big Data Open Source com Hadoop
PDF
Treinamento hadoop - dia3
ODP
Bigdata na pratica: Resolvendo problemas de performance com hadoop
PDF
Treinamento hadoop - dia4
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
A importância do ecossistema Java em aplicações baseadas em Big Data
NoSQL & SQL
Big Data Open Source com Hadoop
Treinamento hadoop - dia3
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Treinamento hadoop - dia4

Mais procurados (9)

PDF
Treinamento Hadoop - dia2
PDF
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
PDF
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
PPTX
Hadoop - primeiros passos
PDF
PPTX
Arquitetura para solução Big Data – open source
PDF
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
PPT
BIGDATA: Da teoria à Pratica
Treinamento Hadoop - dia2
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
Hadoop - primeiros passos
Arquitetura para solução Big Data – open source
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
BIGDATA: Da teoria à Pratica
Anúncio

Semelhante a Introdução ao Apache Hadoop (20)

PDF
Cientista de Dados – Dominando o Big Data com Software Livre
ODP
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
PPTX
Big Data, JVM e Redes Sociais
PPTX
Big data e ecossistema hadoop
PDF
Interoperabilidade com BigData Hadoop para Windows Azure
PDF
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
PPTX
Hadoop - Mãos à massa! Qcon2014
PDF
[LatinoWare 2012] Mini Curso PHP 5.4 + MongoDB
PDF
BIG DATA & IoT: Tecnologias e  Aplicações
PDF
BigData e internte das coisas aplicada a engenharia
PDF
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PDF
João Marcos Araújo do Valle - Big Data
PDF
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
PDF
Big data e mineração de dados
PPTX
Tecnologias para sistemas distribuidos escalaveis
PDF
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
PPTX
BIG DATA na UFSM
PDF
Tirando água da rocha: escalabilidade via software no ExpressoV3
PDF
Pentaho Hadoop Big Data e Data Lakes
Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Big Data, JVM e Redes Sociais
Big data e ecossistema hadoop
Interoperabilidade com BigData Hadoop para Windows Azure
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Hadoop - Mãos à massa! Qcon2014
[LatinoWare 2012] Mini Curso PHP 5.4 + MongoDB
BIG DATA & IoT: Tecnologias e  Aplicações
BigData e internte das coisas aplicada a engenharia
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
João Marcos Araújo do Valle - Big Data
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
Big data e mineração de dados
Tecnologias para sistemas distribuidos escalaveis
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
BIG DATA na UFSM
Tirando água da rocha: escalabilidade via software no ExpressoV3
Pentaho Hadoop Big Data e Data Lakes
Anúncio

Mais de Vinícius Barros (6)

PDF
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
PDF
Desenvolvendo Aplicações baseadas em Big Data com PySpark
PDF
Apresentação LaSDPC
PDF
Apresentação Programação Concorrente USP
PDF
Implantação da ferramenta para manutenção de serviços "UFT Serviços" baseado ...
PDF
Apresentação Coding Dojo em 10 minutos
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Desenvolvendo Aplicações baseadas em Big Data com PySpark
Apresentação LaSDPC
Apresentação Programação Concorrente USP
Implantação da ferramenta para manutenção de serviços "UFT Serviços" baseado ...
Apresentação Coding Dojo em 10 minutos

Último (19)

PDF
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
PDF
Apple Pippin Uma breve introdução. - David Glotz
PPTX
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
PDF
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
PDF
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
PPTX
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PDF
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
PDF
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
PPTX
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
PDF
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
PDF
Processos na gestão de transportes, TM100 Col18
PPTX
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
PPTX
Aula 18 - Manipulacao De Arquivos python
PPTX
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
PDF
Aula04-Academia Heri- Tecnologia Geral 2025
PDF
Custos e liquidação no SAP Transportation Management, TM130 Col18
PDF
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
PDF
COBITxITIL-Entenda as diferença em uso governança TI
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
Apple Pippin Uma breve introdução. - David Glotz
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
Processos na gestão de transportes, TM100 Col18
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
Aula 18 - Manipulacao De Arquivos python
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
Aula04-Academia Heri- Tecnologia Geral 2025
Custos e liquidação no SAP Transportation Management, TM130 Col18
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
COBITxITIL-Entenda as diferença em uso governança TI

Introdução ao Apache Hadoop