Indústria 4.0: como a IoT
e Big Data mudarão a
forma como lidamos
com a tecnologia
2
Sobre...
Vinícius Aires Barros
Ciência da Computação 2016 - UFT
Mestrando em Ciência da Computação - ICMC USP
Laboratório de Sistemas Distribuídos e Programação
Concorrente - LaSDPC
Áreas de Interesse: IoT, Distributed Systems,
Big Data (...)
GitHub: @v4ires
Website: http://viniciusaires.me
E-mail: v4ires@gmail.com
Contextualização
● Big Data (5V’s)
○ Volume
○ Variedade
○ Velocidade
○ Veracidade
○ Valor
● Internet das Coisas (IoT)
● Grandes Volumes de Dados
● Programação Distribuída e
Paralela
● Dados Estruturados, Não
Estruturados e Semiestruturados
● Bancos de Dados SQL e NoSQL
● MapReduce
● Apache Hadoop, Spark, etc.
3
1. Indústria 4.0
Sistemas Ciber Físicos, Internet das
Coisas e Computação em Nuvem
“Indústria 4.0 ou Quarta
Revolução Industrial é uma
expressão que engloba algumas
tecnologias para automação e
troca de dados e utiliza
conceitos de Sistemas
ciber-físicos, Internet das Coisas
e Computação em Nuvem.
5
Revoluções Industriais
6
Internet das Coisas (IoT)
IoT refere-se à uma nova
abordagem sobre a
interconexão de coisas,
tecnologias e objetos,
através da Internet. Essa
abordagem proporcionou ao
longo do tempo a criação da
rede global de dispositivos.
7
Google Trends (IoT vs Big Data)
8
Total de Pesquisas Realizadas no Google em Relação a IoT e
Big Data (Fonte: Google Trends).
Expectativas (IoT)
9
Expectativa de Crescimento da IoT.
Caso de Usos
▪ Cidades Inteligentes
▪ Casas Inteligentes
▪ Hospitais Inteligentes
▪ Smart Everything
10
Dispositivos
11
Protocolos de Comunicação
▪ HTTP: Hypertext Transfer Protocol;
▪ MQTT: Message Queuing Telemetry Transport;
▪ CoAP: Constrained Application Protocol.
12
Ferramentas
13
Desafios
▪ Escalabilidade
▪ Interoperabilidade
▪ Segurança
▪ Aquisição de Dados
▪ Armazenamento
14
2. Big Data
Sinônimo de grande volume de dados?
“Big Data é definido como um
conjunto de dados estruturados
ou não estruturados que não
puderam ser percebidos,
adquiridos, gerenciados e
processados pelos modelos
tradicionais de hardware e
software.
16
MapReduce
17
Casos de Uso
▪ Sistemas de Recomendação
▪ Aprendizagem de Máquina
▪ Processamento de Imagens
▪ Mineração de Dados
▪ etc...
18
Ferramentas
19
Desafios
▪ Escalabilidade
▪ Dados Complexos
▪ Interoperabilidade
▪ Latência
▪ Velocidade de Escrita
em Disco e de RAM
▪ etc...
20
21
O que é Hadoop?
O que é o Hadoop?
O Apache Hadoop é um software de código aberto
mantido pela Apache Foundation que tem como
propósito fornecer uma implementação livre do
modelo de programação MapReduce.
22
Hadoop Timeline
23
Nutch Hadoop
(Nutch sub-project)
Hadoop
3.0.0
2002
MapReduce
2003
Google File
System (GFS)
2004 2006 2017
Hadoop 2.2
2010
Características
24
❏ Implementação em Java
❏ Arquitetura Mestre Escravo (Master/Slave)
❏ Modelo de Programação MapReduce
❏ Hadoop Distributed File System (HDFS)
❏ Memória Secundária (Disco)
❏ Processamento Distribuído
❏ Escalável
❏ Tolerante a Falhas
O que não é?
25
❏ Linguagem de Programação
❏ Biblioteca de Aprendizagem de Máquina
❏ Processamento em Tempo Real
❏ Solução Definitiva
❏ Hadoop ≠ Spark
Hadoop Distributed File System
(HDFS)
26
Configuração
27
Single Node Multi Node
Documentação Oficial: http://hadoop.apache.org/
CMD’s Básicos
Literatura Básica
28
29
O que é Spark?
O que é o Spark?
O Apache Spark é um software de código aberto
mantido pela Apache Foundation que tem como
propósito fornecer uma implementação livre e
melhorada do modelo de programação MapReduce.
30
Spark Timeline
31
UC Berkeley
Lab
Spark se torna um
projeto Top Level da
Apache
2009
Open Source
2010
Projeto da
Fundação
Apache
2013 2014
Spark 2.2.1
2017
Características
32
❏ Implementação em Scala
❏ Arquitetura Mestre Escravo (Master/Slave)
❏ Modelo de Programação MapReduce
❏ Resilient Distributed Dataset (RDD)
❏ Memória Principal (RAM)
❏ Processamento Distribuído
❏ Processamento em Tempo Real
❏ Escalável
❏ Tolerante a Falhas
❏ Integração com HDFS
O que não é?
33
❏ Linguagem de Programação
❏ Solução Definitiva
❏ Substituto do Hadoop
Arquitetura Spark
34
Resilient Distributed Dataset (RDD)
35
Quem utiliza?
36
Literatura Básica
37
Word Count
38
39
Obrigado!
Dúvidas?
Contatos:
@v4ires
v4ires@gmail.com
40

Mais conteúdo relacionado

PDF
Introdução ao Apache Hadoop
PDF
A importância do ecossistema Java em aplicações baseadas em Big Data
PDF
Treinamento Hadoop - dia2
PDF
Treinamento hadoop - dia4
ODP
Bigdata na pratica: Resolvendo problemas de performance com hadoop
PDF
Treinamento hadoop - dia3
PDF
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
PPTX
Arquitetura para solução Big Data – open source
Introdução ao Apache Hadoop
A importância do ecossistema Java em aplicações baseadas em Big Data
Treinamento Hadoop - dia2
Treinamento hadoop - dia4
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Treinamento hadoop - dia3
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Arquitetura para solução Big Data – open source

Mais procurados (16)

PDF
Treinamento hadoop - dia1
PDF
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
ODP
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
PDF
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
PDF
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
PDF
Cientista de Dados – Dominando o Big Data com Software Livre
PPT
BIGDATA: Da teoria à Pratica
PDF
Big Data Open Source com Hadoop
PDF
TDC 2014 - Hadoop Hands ON
PDF
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
ODP
Seminário Hadoop
PDF
Big Data para Leigos
PDF
Pentaho, Hadoop , Big Data e Data Lakes
PDF
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Treinamento hadoop - dia1
XXXI JAI - Apache Hadoop: conceitos teóricos e práticos, evolução e novas pos...
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Cientista de Dados – Dominando o Big Data com Software Livre
BIGDATA: Da teoria à Pratica
Big Data Open Source com Hadoop
TDC 2014 - Hadoop Hands ON
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
Seminário Hadoop
Big Data para Leigos
Pentaho, Hadoop , Big Data e Data Lakes
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Anúncio

Semelhante a Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecnologia (20)

PPTX
Hadoop - Mãos à massa! Qcon2014
PDF
BIG DATA & IoT: Tecnologias e  Aplicações
PDF
BigData e internte das coisas aplicada a engenharia
PPTX
Big Data, JVM e Redes Sociais
PDF
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
PDF
Big data e mineração de dados
PDF
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
PPTX
Big Data
PDF
Pentaho Hadoop Big Data e Data Lakes
PDF
Big Data Week São Paulo 2017
PDF
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
PDF
BigData MapReduce
PDF
Interoperabilidade com BigData Hadoop para Windows Azure
ODP
Big Data Latinoware 2014
PPTX
BigData & Hadoop - Technology Latinoware 2016
PDF
Arquiteturas, Tecnologias e Desafios para Análise de BigData
PPTX
PPTX
BANCO DE DADOS.pptx
PDF
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Hadoop - Mãos à massa! Qcon2014
BIG DATA & IoT: Tecnologias e  Aplicações
BigData e internte das coisas aplicada a engenharia
Big Data, JVM e Redes Sociais
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
Big data e mineração de dados
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Big Data
Pentaho Hadoop Big Data e Data Lakes
Big Data Week São Paulo 2017
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
BigData MapReduce
Interoperabilidade com BigData Hadoop para Windows Azure
Big Data Latinoware 2014
BigData & Hadoop - Technology Latinoware 2016
Arquiteturas, Tecnologias e Desafios para Análise de BigData
BANCO DE DADOS.pptx
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Anúncio

Mais de Vinícius Barros (6)

PDF
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
PDF
Desenvolvendo Aplicações baseadas em Big Data com PySpark
PDF
Apresentação LaSDPC
PDF
Apresentação Programação Concorrente USP
PDF
Implantação da ferramenta para manutenção de serviços "UFT Serviços" baseado ...
PDF
Apresentação Coding Dojo em 10 minutos
Uma Abordagem para a Integração de Diferentes Fontes de Dados Provenientes de...
Desenvolvendo Aplicações baseadas em Big Data com PySpark
Apresentação LaSDPC
Apresentação Programação Concorrente USP
Implantação da ferramenta para manutenção de serviços "UFT Serviços" baseado ...
Apresentação Coding Dojo em 10 minutos

Último (10)

PPTX
AULA_12_BASQUETE CAPACIDADE FÍSICA_171023.pptx
PPTX
SLIDE 1 PARTE 1 Fund da Informatica .pptx
PPTX
organizaoefuncionamentodeunidadedeenfermagem-240414190344-a21272a1 (1).pptx
PPTX
SLIDE 1 PARTE 2 Fund da Informatica .pptx
PPT
Aula_15.pptssssssssssssssssssssssssssssssssssssss
PPTX
slide preparativo para lingua portuguesa
PDF
PROJETO DE PESQUISA PRONTO FONOAUDIOLOGIA 2025 ABNT.pdf
PPTX
Questionario-Fundamentos-de-Informatica-e-Design.pptx
DOCX
Cópia de ACOMPANHAMENTO PARA A RECOMPOSIÇÃO DA APRENDIZAGEM 8 ano História.docx
PDF
Pinealle - Aceleradora de Negócios em Canais Digitais
AULA_12_BASQUETE CAPACIDADE FÍSICA_171023.pptx
SLIDE 1 PARTE 1 Fund da Informatica .pptx
organizaoefuncionamentodeunidadedeenfermagem-240414190344-a21272a1 (1).pptx
SLIDE 1 PARTE 2 Fund da Informatica .pptx
Aula_15.pptssssssssssssssssssssssssssssssssssssss
slide preparativo para lingua portuguesa
PROJETO DE PESQUISA PRONTO FONOAUDIOLOGIA 2025 ABNT.pdf
Questionario-Fundamentos-de-Informatica-e-Design.pptx
Cópia de ACOMPANHAMENTO PARA A RECOMPOSIÇÃO DA APRENDIZAGEM 8 ano História.docx
Pinealle - Aceleradora de Negócios em Canais Digitais

Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecnologia