BIG DATA
WORKSHOP
humberto@humbertomoura.com.br
Humberto Moura
CONCEITOS 2
"Big Data são ativos de informação de alto volume, velocidade e
variedade que exigem formas rentáveis e inovadoras de processamento
de informação para maior insight e tomada de decisão.” (Gartner, 2013).
"Big Data é um termo que descreve dados variáveis, complexos, de
grande volume e de alta velocidade que exigem técnicas e tecnologias
avançadas para permitir a captura, armazenamento, distribuição,
gerenciamento e análise da informação.” (TechAmerica , 2012)
TÓPICO 3
BIG DATA
3
Volume,
Velocidade,
Variedade,
Veracidade,
Valor
CARACTERÍSTICAS TRADICIONAIS DOS DADOS 4
Números;
Gerado por aplicações (ERP, CRM…);
Banco de Dados bem definidos;
Os atributos dos dados dificilmente mudam;
Estão dentro da empresa;
O armazenamento é centralizado.
PROCESSAMENTO TRADICIONAIS DOS DADOS 5
Pequenas distâncias entre origem e uso;
Transferências instantâneas;
Tela para banco de dados;
Banco de dados / processamento / banco de dados
Banco de dados para relatórios;
Validação dos dados na origem;
Dados resumidos e calculados.
ARQUITETURA DOS DADOS TRADICIONAL 6
Armazenamento dos dados Centralizados;
3 Camadas (Persistência, Lógica e Apresentação)
Mudanças requerem projetos de ciclo de vida
completos.
DESAFIOS DOS DADOS TRADICIONAL 7
Não é possível manipular processamento de texto de forma econômica;
Não é possível manipular dados incompletos e não confiáveis;
Alto custo de armazenamento de texto (Hardware e Software);
Backup e restore consomem muito tempo;
Alto gerenciamento / custo de licenciamento;
Mudanças no banco tomam muito tempo para refazer aplicação.
CARACTERÍSTICAS APLICAÇÕES BIG DATA 8
Dados estão na faixa de Tera ou Peta Bytes
Mais do que uma origem dos dados;
Dados de texto ou mídia (áudio, vídeo, imagens…);
Carga de processamento gigantesca;
Processamento de streaming em tempo real;
Análises avançadas;
Custo de manipulação relativamente barato;
MODELO BIG DATA 9
OBTER
TRANSPORTAR
TRANSFORMAR
PERSISTIR
REPORTAR
ANALISAR
GERENCIAR
MODELO BIG DATA 10
OBTER
Arquivos (texto, cvs, json, xml…)
SGBDR (SQL, Joins, Group By…)
REST
Streaming
MODELO BIG DATA 11
Mover /copiar arquivos
SFTP
Apache Sqoop
TRANSPORTAR
MODELO BIG DATA 12
Arquivos
SGBD
HDFS
PERSISTIR
MODELO BIG DATA 13
Limpar
Filtrar
Padronizar
Enriquecer
Integrar
TRANSFORMAR
MODELO BIG DATA 14
Extrair dados da persistência
Autenticação
tempo real
gráficos
REPORTAR
MODELO BIG DATA 15
Descritiva: entender o que aconteceu;
Exploratória: Descobrir porque algo aconteceu;
Inferência: a população de uma amostra;
Preditiva: previsão do que vai acontecer;
Causal: O que acontece com uma variável se mudar outra;
Deep: Técnica avançada para grandes dados e múltiplas origens.
ANALISAR Tipos de Análise
MODELO BIG DATA 16
ANALISAR
INTRODUÇÃO AO TABLEAU 17
http://
download.inep.gov.br//
educacao_basica/
enem/
enem_por_escola/
2015/
Planilhas_Enem_2015_
download.xlsx
Download para prática:
http://www.tableau.com/pt-br/products/desktop
OBRIGADO! 18
OBRIGADO!

Mais conteúdo relacionado

PDF
Business intelligence
PDF
Hadoop, Big Data e Cloud Computing
PPTX
PDF
Big data
PDF
Governança de Dados e Big Data
PDF
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
PDF
Data warehouse & data mining
PDF
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
Business intelligence
Hadoop, Big Data e Cloud Computing
Big data
Governança de Dados e Big Data
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Data warehouse & data mining
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...

Mais procurados (20)

PPTX
Big data
PDF
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
PPTX
Data Mining
PPTX
Live - BigData
PDF
Diálogos entre cientistas de dados e cientistas sociais
PPTX
Big Data
PDF
Big Data e Data Science - Tecnologia e Mercado
PPTX
Workshop BigData, Hadoop e Data Science - Cetax x Deal
PDF
Apresentação data mining
PPTX
Big Data, NoSQL e In Memory Databases
PDF
Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...
PPTX
Ativando Inteligência com Big Data
PPT
Data mining
PPT
Data mining
PDF
Business Intelligence - Data Warehouse
PDF
Big data e mineração de dados
PPT
Data mining
PPTX
Gestão de informações no ambiente agro industrial
PPT
O que é Data Science?
DOC
Exploracao datawarehouse mineracao_de_dados_ou_olap
Big data
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Data Mining
Live - BigData
Diálogos entre cientistas de dados e cientistas sociais
Big Data
Big Data e Data Science - Tecnologia e Mercado
Workshop BigData, Hadoop e Data Science - Cetax x Deal
Apresentação data mining
Big Data, NoSQL e In Memory Databases
Caçadores de Mitos: A virtualização dos dados pode sustentar o desempenho com...
Ativando Inteligência com Big Data
Data mining
Data mining
Business Intelligence - Data Warehouse
Big data e mineração de dados
Data mining
Gestão de informações no ambiente agro industrial
O que é Data Science?
Exploracao datawarehouse mineracao_de_dados_ou_olap
Anúncio

Semelhante a Big data Workshop (20)

PDF
PPT
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
PDF
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
PPTX
Aula BigData.pptx
PPT
BigData
PDF
Aula - BIG DATA (conceitos, recursos, tendências e oportunidades.)
PPTX
Hackathon Inmetrics e Fiap: Desafios do Big Data
PDF
Big data: Conceitos e Desafios
PDF
aula1 - Bigdata.pdf
PPSX
Sparsi big data
PPT
Big Data - uma visão executiva
DOC
Artigo big data_final
PDF
Big Data: Seus problemas estão apenas começando
PDF
Texto - 3º cictec - Big Data.docx
ODP
Big Data - Conceitos Básicos
PPTX
Big Data e NoSQL
ODP
Palestra Introdução a Big Data
PDF
Bigdata - Leandro Wanderley
PDF
Big Data Analytics
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
Aula BigData.pptx
BigData
Aula - BIG DATA (conceitos, recursos, tendências e oportunidades.)
Hackathon Inmetrics e Fiap: Desafios do Big Data
Big data: Conceitos e Desafios
aula1 - Bigdata.pdf
Sparsi big data
Big Data - uma visão executiva
Artigo big data_final
Big Data: Seus problemas estão apenas começando
Texto - 3º cictec - Big Data.docx
Big Data - Conceitos Básicos
Big Data e NoSQL
Palestra Introdução a Big Data
Bigdata - Leandro Wanderley
Big Data Analytics
Anúncio

Último (20)

PPTX
AULA 5 - HIGIENE HOSPITALAR .pptx
PPTX
02-simulado-saeb-9o-ano-matematica1.pptx
PPTX
Basic life Support - suporte tecnico de vida
PPTX
125511 - Aula 1 - América portuguesa antes da conquista patrimônio e preserva...
PPTX
História da enfermagem 14.07.2025_040859.pptx
PPTX
Primeiros Socorros. Aula 1 VEROUVIRSENTIR.pptx
PPTX
AULA 01 - INTRODUÇÃO AO ATENDIMENTO HUMANIZADO.pptx
PDF
DECISÃO (2).pdf Derrota histórica do Sintero expõe racha interno e fragilidad...
PDF
E-BOOK-Inovacao-em-Ciencia-e-Tecnologia-de-Alimentos.pdf
PDF
projeto 5 Em movimento Ciencias Humanas.pdf
PDF
diário de palestra DDS Online - Apostila.pdf
PPTX
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
PDF
Reino Monera - Biologiaensinomediofun.pdf
PPTX
SEGURANÇA, MEIO AMBIENTE E SAÚDE Aula 1.pptx
PPTX
125519 - Aula 2 - Riqueza e diversidade povos indígenas na América Portuguesa...
PDF
ENTREVISTA-PROCESSO-SELETIVO-idc8j5.pdf 1
PPTX
QUIZ_LÍNGUA PORTUGUESA_WALDO/QUIZ_LÍNGUA PORTUGUESA_WALDO.pptx
PPTX
O amor e a mulher - Romantismo no Brasil.pptx
PPTX
entorseestadodechoque. Aula de primeiros socorros
PPTX
Treinamento de Espaço Confinado_Trabalhadores e Vigias NR 33.pptx
AULA 5 - HIGIENE HOSPITALAR .pptx
02-simulado-saeb-9o-ano-matematica1.pptx
Basic life Support - suporte tecnico de vida
125511 - Aula 1 - América portuguesa antes da conquista patrimônio e preserva...
História da enfermagem 14.07.2025_040859.pptx
Primeiros Socorros. Aula 1 VEROUVIRSENTIR.pptx
AULA 01 - INTRODUÇÃO AO ATENDIMENTO HUMANIZADO.pptx
DECISÃO (2).pdf Derrota histórica do Sintero expõe racha interno e fragilidad...
E-BOOK-Inovacao-em-Ciencia-e-Tecnologia-de-Alimentos.pdf
projeto 5 Em movimento Ciencias Humanas.pdf
diário de palestra DDS Online - Apostila.pdf
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
Reino Monera - Biologiaensinomediofun.pdf
SEGURANÇA, MEIO AMBIENTE E SAÚDE Aula 1.pptx
125519 - Aula 2 - Riqueza e diversidade povos indígenas na América Portuguesa...
ENTREVISTA-PROCESSO-SELETIVO-idc8j5.pdf 1
QUIZ_LÍNGUA PORTUGUESA_WALDO/QUIZ_LÍNGUA PORTUGUESA_WALDO.pptx
O amor e a mulher - Romantismo no Brasil.pptx
entorseestadodechoque. Aula de primeiros socorros
Treinamento de Espaço Confinado_Trabalhadores e Vigias NR 33.pptx

Big data Workshop

  • 2. CONCEITOS 2 "Big Data são ativos de informação de alto volume, velocidade e variedade que exigem formas rentáveis e inovadoras de processamento de informação para maior insight e tomada de decisão.” (Gartner, 2013). "Big Data é um termo que descreve dados variáveis, complexos, de grande volume e de alta velocidade que exigem técnicas e tecnologias avançadas para permitir a captura, armazenamento, distribuição, gerenciamento e análise da informação.” (TechAmerica , 2012)
  • 4. CARACTERÍSTICAS TRADICIONAIS DOS DADOS 4 Números; Gerado por aplicações (ERP, CRM…); Banco de Dados bem definidos; Os atributos dos dados dificilmente mudam; Estão dentro da empresa; O armazenamento é centralizado.
  • 5. PROCESSAMENTO TRADICIONAIS DOS DADOS 5 Pequenas distâncias entre origem e uso; Transferências instantâneas; Tela para banco de dados; Banco de dados / processamento / banco de dados Banco de dados para relatórios; Validação dos dados na origem; Dados resumidos e calculados.
  • 6. ARQUITETURA DOS DADOS TRADICIONAL 6 Armazenamento dos dados Centralizados; 3 Camadas (Persistência, Lógica e Apresentação) Mudanças requerem projetos de ciclo de vida completos.
  • 7. DESAFIOS DOS DADOS TRADICIONAL 7 Não é possível manipular processamento de texto de forma econômica; Não é possível manipular dados incompletos e não confiáveis; Alto custo de armazenamento de texto (Hardware e Software); Backup e restore consomem muito tempo; Alto gerenciamento / custo de licenciamento; Mudanças no banco tomam muito tempo para refazer aplicação.
  • 8. CARACTERÍSTICAS APLICAÇÕES BIG DATA 8 Dados estão na faixa de Tera ou Peta Bytes Mais do que uma origem dos dados; Dados de texto ou mídia (áudio, vídeo, imagens…); Carga de processamento gigantesca; Processamento de streaming em tempo real; Análises avançadas; Custo de manipulação relativamente barato;
  • 9. MODELO BIG DATA 9 OBTER TRANSPORTAR TRANSFORMAR PERSISTIR REPORTAR ANALISAR GERENCIAR
  • 10. MODELO BIG DATA 10 OBTER Arquivos (texto, cvs, json, xml…) SGBDR (SQL, Joins, Group By…) REST Streaming
  • 11. MODELO BIG DATA 11 Mover /copiar arquivos SFTP Apache Sqoop TRANSPORTAR
  • 12. MODELO BIG DATA 12 Arquivos SGBD HDFS PERSISTIR
  • 13. MODELO BIG DATA 13 Limpar Filtrar Padronizar Enriquecer Integrar TRANSFORMAR
  • 14. MODELO BIG DATA 14 Extrair dados da persistência Autenticação tempo real gráficos REPORTAR
  • 15. MODELO BIG DATA 15 Descritiva: entender o que aconteceu; Exploratória: Descobrir porque algo aconteceu; Inferência: a população de uma amostra; Preditiva: previsão do que vai acontecer; Causal: O que acontece com uma variável se mudar outra; Deep: Técnica avançada para grandes dados e múltiplas origens. ANALISAR Tipos de Análise
  • 16. MODELO BIG DATA 16 ANALISAR
  • 17. INTRODUÇÃO AO TABLEAU 17 http:// download.inep.gov.br// educacao_basica/ enem/ enem_por_escola/ 2015/ Planilhas_Enem_2015_ download.xlsx Download para prática: http://www.tableau.com/pt-br/products/desktop