BigData e IOT
Alessandro de Oliveira Binhara
Data Scientist – Horton Works System Integrator
binhara@azuris.com.br
Alessandro Binhara
Data Scientist & Mobile Expert
Mestre em Tecnologia (UTFPR)
Bacharel em TIC, Técnico Eletrônica (CEFET-PR)
Mono Hacker desde 2003
Fundador Projeto MonoBrasil
Linguagens Fluente: C#, Java, PIG, PHP, Ruby., ...
BigData: Hadoop, MapReduce Mahout, Hbase, Cassandra,
Hive, Sqoop,
Consultor Autorizado Xamarin
Consultor BigData pela Hortonhorks
O que é ?
 Coisas” que se comunicam, armazenam e
processam dados com o mínimo de interferência
humana, integradas a rede mundial de
computadores.
IOT e Bigdata ???
 Dispositivos vestíveis pelas pessoas. Máquinas que
coletam dados e atuam sobre às pessoas
IOT e Bidata
BIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  Aplicações
Cadeia de Valor do BigData
 Coleção - Dados estruturados, não estruturados e semi-estruturados de múltiplas fontes
 Ingestão - carregamento de grandes quantidades de dados em um único armazenamento de dados
 Discovery & Cleansing - compreensão do formato e conteúdo; Limpeza e formatação
 Integração - vinculação, extração de entidade, resolução de entidade, indexação e fusão de dados
 Análise - Inteligência, estatística, análise preditiva e de texto, aprendizado de máquina
 Entrega - consulta, visualização, entrega em tempo real com disponibilidade de classe empresarial
Collection Ingestion
Discovery
&
Cleansing
Integratio
n
Analysis Delivery
Porque e Quando ?
Considerações para a grande
padronização de dados
 Variedade de Casos de Uso
 Mobilidade
 Segurança e privacidade
 Gerenciamento do ciclo de vida e
qualidade dos dados
 Gerenciamento do sistema e outros
problemas
 Características dos dados
 Distribuído / Centralizado
 Os 4 V's: Volume, Velocidade,
Variedade, Veracidade
 Coleção de dados
 Visualização de dados
 Qualidade dos dados
 Análise de dados e ação
DataSource
Source
 Sensores
 Aplicações
 Agentes de software
 Indivíduos
 Organizações
 Recursos de hardware
 Fontes de dados publicas
 Sites internet
 Redes Sociais
Any*
 A qualquer momento
 Qualquer coisa
 Qualquer Dispositivo
 Qualquer Contexto
 Qualquer lugar
 Qualquer lugar
 Alguém
IOT Aplicado a SmartCitys ???
 Como pode funcionar ?
 Como Coletar os dados ?
 Como Armazenar ???
 Como processar ???
 Como Tornar uma cidade inteligente ??

Cluster no Hadoop no Yahoo
 Atualmente o Yahoo tem 3 cluster com mais de 42mil máquinas para testes
BIG DATA & IoT: Tecnologias e  Aplicações
Facebook Data Center
Uso Comum do Hadoop – Case ...
1. Social
Entenda como seus clientes se sentem sobre a sua marca
e produtos – agora
2. Clickstream
Capturar e analisar as pistas de dados visitantes do site e
otimizar seu site
3. Sensor/Machine
Descobrir padrões nos dados que fluem automaticamente
a partir de sensores e máquinas remotas
4. Geolocation
Analisar dados baseados em localização para gerenciar as
operações onde ocorrem
5. Server Logs
Log de pesquisa para diagnosticar falhas no processo e
prevenir violações de segurança
6. Unstructured (text, video, pictures, etc..)
Compreender padrões de texto através de milhões de
produtos de trabalho não estruturados: páginas web, e-
mails, vídeos, fotos e documentos
Valor
O que é Hadoop ?
 O Apache Hadoop é um projeto desenvolvimento como open-
source software para escalável , confiável e com processamento
distribuído.
 Um sistema escalável e confiável para armazenamento
compartilhado e análises.
 Ele automaticamente trata da replicação de dados e das falhas
em cada nó.
 Ele faz o trabalho duro, o desenvolvedor pode se concentrar
em processamento da lógica de dados
 Permite que os aplicativos usem petabytes de dados em
paralelo.
O que é BigData ?
Curiosidades sobre ZetaBytes
Camadas
Compartivo
 SQL
 Banco Relacional
 Escalabilidade vertical
 Terabytes
 RAID, HDs rápidos
 Mais dados, troque o servidor
 BigTable
 Escalabilidade horizontal
 Petabytes
 CPU Rápida/ Baixo custo
 Padrão, HDs duráveis
 Mais dados, adicione mais
servidores
Bigatable is a sparse, distributed persistence
multidimensional sorted map.
PETABYTES
O que map reduce ?
 Estratégia de dividir para conquistar
 MapReduce é um modelo de programação e implementação associados
para o processamento e geração de grandes conjuntos de dados (Jeffrey
Dean e Sanjay Ghemawat, 2004)
 Baseado em um modelo de programação funcional (como Lisp, Ml, etc)
 Processamento de dados base em batch
 A abstração limpa para programadores
 Paralelização automática e distribuição
 Tolerância a falhas
MapReduce
Bigdata é o mundo do cobertor curto...
BIG DATA & IoT: Tecnologias e  Aplicações
Processamento
 MapReduce 2 (yarn)
 Apache Spark
 Apache TEZ
 Apache Storm
SQL/DB
 Spark SQL
 Impala
 Hive
 Presto
Data Flow
 Flume (logs, files)
 Sqoop (sync,sql)
 Kafka (msg)
 Nifi (proc/dist)
Suporte e administração
 Oozie (workflow,sched)
 Zookeeper(coord,config)
 Ambari (monitor, managing)
Outros
 PIG, jaql, hive
 Mahout, Mlib, H2O
 Solar
 Zepelin
Casos em SmartCitys
Casos TomTom
 Empresa de GPS
 Vendendo os hábitos dos motoristas para a policia
local para chegar em casa mais rápido
 A policia passou a colocar radares e fiscalizar
essas rodas
 Aplicando multas aos motoristas
Sistema
BigData China
Captura e Processamento dos Vídeos
 As imagens são capturadas e processadas em
tempo real.
 Podemos notar as marcações realizadas pelo
software de análise.
 Ele consegue identificar os carros em movimentos
e verificar várias infrações, como :
 Velocidade acima de 10% do limite
 Velocidade acima de 20% do limite
 Avanço de Sinal
 Caminhão fora de horário
 Sobre a faixa de pedestre
CaseAGENT - Central inteligente de
Trânsito Semáforo inteligente
Exemplo de Relatório
 asd
PrótotipoPasseio Virtual
Sala de Operações
Produto Brasileiro
Startup Paranaense
Lançamento na CES em Las Vegas
http://beenoculus.com.br/
‘
Monitoramento de Transito
Sala de Operações
Este é nosso quarto operacional. Projeção
de realidade estendido usando o Novell.
Este quarto tem favoritos em toda a sua
volta. No chão, temos um mapa da cidade
de Curitiba, onde com a utilização de um
óculos de realidade aumentada. A
informação recolhida é projetada para
câmeras. Imagens são processadas em um
cluster de Hadoop
Imagine....
Como deixo minha meu Sistema
Inteligente ???
 Processamento em Realtime
 Bases de conhecimento
 Maquinas de Aprendizado
 Sistema de Recomendação .
Treinamentos
Presencias, On-line e Semipresenciais
 Curso: Apache Hadoop Essencial
(8horas )
 Curso: Introdução ao Futuro Cientista
de Dados (8h)
 Curso: DataScientist e BigData for
Bussines (16h)
 Curso: Apache Hadoop Fundamental
(24h)
 Treinamento e Workshop
Ferramentas de BigData com
EcoSistema Hadoop (40h)
 Treinamento Apache Sqoop (8h)
 Treinamento Apache Cassandra (16h)
 Treinamento HBase (16h)
 Treinamento Hive (16h)
 Treimento Mahout (16h)
 Curso + Treinamento em BI aplicado a
máquinas de aprendizado Mahout
(30h)
 Curso de Splunk (16h)
 Curso Pig e Pig Latin (16h)
 Curos de Programaçao em MapReduce
com Java e C# (16h)
 Curso de Flume (16h)
Perguntas ???
Binhara@azuris.com.br
@binhara
www.azuris.com.br

Mais conteúdo relacionado

PDF
Big data Workshop
PDF
Hadoop, Big Data e Cloud Computing
PPTX
Arquitetura para solução Big Data – open source
PDF
Data Lakes com Hadoop e Spark: Agile Analytics na prática
PPT
BIGDATA: Da teoria à Pratica
PDF
Big Data - O que é o hadoop, map reduce, hdfs e hive
PPTX
Hadoop - Mãos à massa! Qcon2014
PDF
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Big data Workshop
Hadoop, Big Data e Cloud Computing
Arquitetura para solução Big Data – open source
Data Lakes com Hadoop e Spark: Agile Analytics na prática
BIGDATA: Da teoria à Pratica
Big Data - O que é o hadoop, map reduce, hdfs e hive
Hadoop - Mãos à massa! Qcon2014
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...

Mais procurados (6)

PDF
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
PPTX
Big data e ecossistema hadoop
ODP
Bigdata na pratica: Resolvendo problemas de performance com hadoop
ODP
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
PPTX
Ingestão de Dados
PPTX
Armazenamento Elástico de Dados Relacionais no Azure
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Big data e ecossistema hadoop
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Ingestão de Dados
Armazenamento Elástico de Dados Relacionais no Azure
Anúncio

Destaque (20)

PPTX
IBM Bluemix and the Internet of Things - Workshop
PDF
Bigadata casese opotunidades
PDF
Introduçãoo aws, escalando uma aplicação Web
PDF
Big data - Conhecendo as Tecnologias
PDF
IBM Bluemix Garage in London
PDF
Bigdata IoT Cluster
PDF
Desenvolvimento de Games para Mobile.
PDF
Xamarin plataform
PPTX
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
ODP
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
PDF
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
PPTX
De dev para data scientist 3 coisas que aprendi
PPT
Usabilidade de interface para busca e recuperação de informação na web
PDF
Curso C# em Mono - Orientação a Objeto Basico
PDF
Palestra MVP living lab ms
PDF
Primeiros passos com o Cassandra
PDF
Mantendo seu Tempo a salvo com Python e Git
PDF
Mineração de dados na prática com RapidMiner e Weka
PDF
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
PDF
Mineração de dados e novas oportunidades de análise para sistemas de informação
IBM Bluemix and the Internet of Things - Workshop
Bigadata casese opotunidades
Introduçãoo aws, escalando uma aplicação Web
Big data - Conhecendo as Tecnologias
IBM Bluemix Garage in London
Bigdata IoT Cluster
Desenvolvimento de Games para Mobile.
Xamarin plataform
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
De dev para data scientist 3 coisas que aprendi
Usabilidade de interface para busca e recuperação de informação na web
Curso C# em Mono - Orientação a Objeto Basico
Palestra MVP living lab ms
Primeiros passos com o Cassandra
Mantendo seu Tempo a salvo com Python e Git
Mineração de dados na prática com RapidMiner e Weka
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de dados e novas oportunidades de análise para sistemas de informação
Anúncio

Semelhante a BIG DATA & IoT: Tecnologias e  Aplicações (20)

PPTX
Big Data: O que é? e por onde começar?
PDF
Como o Magazine Luiza inova suas operações utilizando as soluções de IoT e Bi...
PPTX
Big Data, JVM e Redes Sociais
PDF
Big data e mineração de dados
PPTX
AWS Initiate - AWS & IoT (Internet das Coisas) - Smart Cities
PDF
Interoperabilidade com BigData Hadoop para Windows Azure
PDF
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
PDF
Cientista de Dados – Dominando o Big Data com Software Livre
PDF
Internet das coisas, machine learnign e maquinas de doces
PDF
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
PDF
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PDF
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
PDF
Palestra Edge Computing Sistemas Embarcados.pdf
PPTX
Parse - Backend As A Service
PPTX
Big Data
PPTX
Bigdata alexandre v2
PDF
Microsoft Azure: Fundação para Transformação Digital
PDF
Treinamento hadoop - dia4
PDF
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
PDF
Big data - Uma visão geral da coisa...
Big Data: O que é? e por onde começar?
Como o Magazine Luiza inova suas operações utilizando as soluções de IoT e Bi...
Big Data, JVM e Redes Sociais
Big data e mineração de dados
AWS Initiate - AWS & IoT (Internet das Coisas) - Smart Cities
Interoperabilidade com BigData Hadoop para Windows Azure
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Cientista de Dados – Dominando o Big Data com Software Livre
Internet das coisas, machine learnign e maquinas de doces
Intelligence, Discovery, Analytics e Data Science: Evolução, Desafios e Oport...
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
Palestra Edge Computing Sistemas Embarcados.pdf
Parse - Backend As A Service
Big Data
Bigdata alexandre v2
Microsoft Azure: Fundação para Transformação Digital
Treinamento hadoop - dia4
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
Big data - Uma visão geral da coisa...

Mais de Alessandro Binhara (20)

PDF
ApresentacaoEngehariaBrinquedojulho-2024-v1.pdf
PPTX
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
PDF
BigData e internte das coisas aplicada a engenharia
PDF
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
PDF
Latinoware 2019 - DEsenvolvimento mobile em Nivel jedi
PPT
2019 latinoware - O mundo novo da realidade virtual
PDF
Realidade Virtual e a Ciência de Dados -latinoware
PPT
Realidade Virtual e a Ciência de Dados
PPT
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
PPTX
Curso de Férias - Robótica
PDF
Games imersivos
PPTX
Abertura - interopmix2014
PDF
Treinamento csharp mono
PPTX
Int305 projeto mono-final
PDF
Apresentação Final a FINEP Projeto MonoBasic
PDF
App CrossMobile com C# para Android, Iphone e WindowsPhone
PDF
Xamarin Interop - hands on android -
PDF
Quarto Encontro GUX
PDF
Usando c# para desenvolver app iphone e ipad!!! sim é possível!!!
PPTX
Interop itcare: Interoperabilidade Java e .NET
ApresentacaoEngehariaBrinquedojulho-2024-v1.pdf
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
BigData e internte das coisas aplicada a engenharia
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Latinoware 2019 - DEsenvolvimento mobile em Nivel jedi
2019 latinoware - O mundo novo da realidade virtual
Realidade Virtual e a Ciência de Dados -latinoware
Realidade Virtual e a Ciência de Dados
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
Curso de Férias - Robótica
Games imersivos
Abertura - interopmix2014
Treinamento csharp mono
Int305 projeto mono-final
Apresentação Final a FINEP Projeto MonoBasic
App CrossMobile com C# para Android, Iphone e WindowsPhone
Xamarin Interop - hands on android -
Quarto Encontro GUX
Usando c# para desenvolver app iphone e ipad!!! sim é possível!!!
Interop itcare: Interoperabilidade Java e .NET

Último (20)

PDF
Apresentação Empregado por Posto Adicional
PDF
Pesquisa Operacional - Programação Linear
PPTX
Treinamento em powerpoint para integração de colaboradores em fábrica de pequ...
PPT
22a Aula Manejo de Plantas Daninhas(1).ppt
PDF
LIMPEZA E SANITIZAÇÃO NA INDUSTRIA ALIMENTICIA
PDF
1 - Aula Pneumática Elementos da Pneumática.pdf
PDF
MATERIAIS DE CONSTRUÇÃO Solo cimento - 07.pdf
PPTX
PILOTAGEM-SISTEMAS DE GESTÃO DA CADEIA DE SUPLIMENTOS
PDF
Reacoes_expansivas_no_concreto_DEF_ABCP_dez2020.pdf
PDF
3 - Condução de Calor Permanante (Coordendas Retangulares, Cilíndricas e Esfé...
PDF
Boas práticas em rebobinamento trifásico .pdf
PPTX
cultivo de folhosas alface rúcula almeirão.pptx
PPT
Primeiros Socorros e Saúde Ocupacional Ferrosos Sul.ppt
PPTX
1_Aula_de_Pesquisa_Aplicada__Engenharia____P_2024.2.pptx
PPTX
NR35 - Treinamento Aurea Medic - altura.pptx
PDF
Mapa de Oferta Eng Civil (20h 02min, 06-08-2025).pdf
PDF
Impactos ambientais gerados pela construção civil
PDF
MIP Manejo integrado de pragas na cultura do algodão
PPT
1 - Serviços em Eletricidade - 1° SOS RCP DEA - Rev a.ppt
PPTX
Slide_Atualizações dos Protocolos de BLS e ACLS.pptx
Apresentação Empregado por Posto Adicional
Pesquisa Operacional - Programação Linear
Treinamento em powerpoint para integração de colaboradores em fábrica de pequ...
22a Aula Manejo de Plantas Daninhas(1).ppt
LIMPEZA E SANITIZAÇÃO NA INDUSTRIA ALIMENTICIA
1 - Aula Pneumática Elementos da Pneumática.pdf
MATERIAIS DE CONSTRUÇÃO Solo cimento - 07.pdf
PILOTAGEM-SISTEMAS DE GESTÃO DA CADEIA DE SUPLIMENTOS
Reacoes_expansivas_no_concreto_DEF_ABCP_dez2020.pdf
3 - Condução de Calor Permanante (Coordendas Retangulares, Cilíndricas e Esfé...
Boas práticas em rebobinamento trifásico .pdf
cultivo de folhosas alface rúcula almeirão.pptx
Primeiros Socorros e Saúde Ocupacional Ferrosos Sul.ppt
1_Aula_de_Pesquisa_Aplicada__Engenharia____P_2024.2.pptx
NR35 - Treinamento Aurea Medic - altura.pptx
Mapa de Oferta Eng Civil (20h 02min, 06-08-2025).pdf
Impactos ambientais gerados pela construção civil
MIP Manejo integrado de pragas na cultura do algodão
1 - Serviços em Eletricidade - 1° SOS RCP DEA - Rev a.ppt
Slide_Atualizações dos Protocolos de BLS e ACLS.pptx

BIG DATA & IoT: Tecnologias e  Aplicações

  • 1. BigData e IOT Alessandro de Oliveira Binhara Data Scientist – Horton Works System Integrator binhara@azuris.com.br
  • 2. Alessandro Binhara Data Scientist & Mobile Expert Mestre em Tecnologia (UTFPR) Bacharel em TIC, Técnico Eletrônica (CEFET-PR) Mono Hacker desde 2003 Fundador Projeto MonoBrasil Linguagens Fluente: C#, Java, PIG, PHP, Ruby., ... BigData: Hadoop, MapReduce Mahout, Hbase, Cassandra, Hive, Sqoop, Consultor Autorizado Xamarin Consultor BigData pela Hortonhorks
  • 3. O que é ?  Coisas” que se comunicam, armazenam e processam dados com o mínimo de interferência humana, integradas a rede mundial de computadores.
  • 4. IOT e Bigdata ???  Dispositivos vestíveis pelas pessoas. Máquinas que coletam dados e atuam sobre às pessoas
  • 8. Cadeia de Valor do BigData  Coleção - Dados estruturados, não estruturados e semi-estruturados de múltiplas fontes  Ingestão - carregamento de grandes quantidades de dados em um único armazenamento de dados  Discovery & Cleansing - compreensão do formato e conteúdo; Limpeza e formatação  Integração - vinculação, extração de entidade, resolução de entidade, indexação e fusão de dados  Análise - Inteligência, estatística, análise preditiva e de texto, aprendizado de máquina  Entrega - consulta, visualização, entrega em tempo real com disponibilidade de classe empresarial Collection Ingestion Discovery & Cleansing Integratio n Analysis Delivery
  • 10. Considerações para a grande padronização de dados  Variedade de Casos de Uso  Mobilidade  Segurança e privacidade  Gerenciamento do ciclo de vida e qualidade dos dados  Gerenciamento do sistema e outros problemas  Características dos dados  Distribuído / Centralizado  Os 4 V's: Volume, Velocidade, Variedade, Veracidade  Coleção de dados  Visualização de dados  Qualidade dos dados  Análise de dados e ação
  • 11. DataSource Source  Sensores  Aplicações  Agentes de software  Indivíduos  Organizações  Recursos de hardware  Fontes de dados publicas  Sites internet  Redes Sociais Any*  A qualquer momento  Qualquer coisa  Qualquer Dispositivo  Qualquer Contexto  Qualquer lugar  Qualquer lugar  Alguém
  • 12. IOT Aplicado a SmartCitys ???  Como pode funcionar ?  Como Coletar os dados ?  Como Armazenar ???  Como processar ???  Como Tornar uma cidade inteligente ?? 
  • 13. Cluster no Hadoop no Yahoo  Atualmente o Yahoo tem 3 cluster com mais de 42mil máquinas para testes
  • 16. Uso Comum do Hadoop – Case ... 1. Social Entenda como seus clientes se sentem sobre a sua marca e produtos – agora 2. Clickstream Capturar e analisar as pistas de dados visitantes do site e otimizar seu site 3. Sensor/Machine Descobrir padrões nos dados que fluem automaticamente a partir de sensores e máquinas remotas 4. Geolocation Analisar dados baseados em localização para gerenciar as operações onde ocorrem 5. Server Logs Log de pesquisa para diagnosticar falhas no processo e prevenir violações de segurança 6. Unstructured (text, video, pictures, etc..) Compreender padrões de texto através de milhões de produtos de trabalho não estruturados: páginas web, e- mails, vídeos, fotos e documentos Valor
  • 17. O que é Hadoop ?  O Apache Hadoop é um projeto desenvolvimento como open- source software para escalável , confiável e com processamento distribuído.  Um sistema escalável e confiável para armazenamento compartilhado e análises.  Ele automaticamente trata da replicação de dados e das falhas em cada nó.  Ele faz o trabalho duro, o desenvolvedor pode se concentrar em processamento da lógica de dados  Permite que os aplicativos usem petabytes de dados em paralelo.
  • 18. O que é BigData ?
  • 21. Compartivo  SQL  Banco Relacional  Escalabilidade vertical  Terabytes  RAID, HDs rápidos  Mais dados, troque o servidor  BigTable  Escalabilidade horizontal  Petabytes  CPU Rápida/ Baixo custo  Padrão, HDs duráveis  Mais dados, adicione mais servidores
  • 22. Bigatable is a sparse, distributed persistence multidimensional sorted map. PETABYTES
  • 23. O que map reduce ?  Estratégia de dividir para conquistar  MapReduce é um modelo de programação e implementação associados para o processamento e geração de grandes conjuntos de dados (Jeffrey Dean e Sanjay Ghemawat, 2004)  Baseado em um modelo de programação funcional (como Lisp, Ml, etc)  Processamento de dados base em batch  A abstração limpa para programadores  Paralelização automática e distribuição  Tolerância a falhas
  • 25. Bigdata é o mundo do cobertor curto...
  • 27. Processamento  MapReduce 2 (yarn)  Apache Spark  Apache TEZ  Apache Storm
  • 28. SQL/DB  Spark SQL  Impala  Hive  Presto
  • 29. Data Flow  Flume (logs, files)  Sqoop (sync,sql)  Kafka (msg)  Nifi (proc/dist)
  • 30. Suporte e administração  Oozie (workflow,sched)  Zookeeper(coord,config)  Ambari (monitor, managing)
  • 31. Outros  PIG, jaql, hive  Mahout, Mlib, H2O  Solar  Zepelin
  • 33. Casos TomTom  Empresa de GPS  Vendendo os hábitos dos motoristas para a policia local para chegar em casa mais rápido  A policia passou a colocar radares e fiscalizar essas rodas  Aplicando multas aos motoristas
  • 35. Captura e Processamento dos Vídeos  As imagens são capturadas e processadas em tempo real.  Podemos notar as marcações realizadas pelo software de análise.  Ele consegue identificar os carros em movimentos e verificar várias infrações, como :  Velocidade acima de 10% do limite  Velocidade acima de 20% do limite  Avanço de Sinal  Caminhão fora de horário  Sobre a faixa de pedestre
  • 36. CaseAGENT - Central inteligente de Trânsito Semáforo inteligente
  • 38. PrótotipoPasseio Virtual Sala de Operações Produto Brasileiro Startup Paranaense Lançamento na CES em Las Vegas http://beenoculus.com.br/ ‘
  • 39. Monitoramento de Transito Sala de Operações Este é nosso quarto operacional. Projeção de realidade estendido usando o Novell. Este quarto tem favoritos em toda a sua volta. No chão, temos um mapa da cidade de Curitiba, onde com a utilização de um óculos de realidade aumentada. A informação recolhida é projetada para câmeras. Imagens são processadas em um cluster de Hadoop
  • 41. Como deixo minha meu Sistema Inteligente ???  Processamento em Realtime  Bases de conhecimento  Maquinas de Aprendizado  Sistema de Recomendação .
  • 42. Treinamentos Presencias, On-line e Semipresenciais  Curso: Apache Hadoop Essencial (8horas )  Curso: Introdução ao Futuro Cientista de Dados (8h)  Curso: DataScientist e BigData for Bussines (16h)  Curso: Apache Hadoop Fundamental (24h)  Treinamento e Workshop Ferramentas de BigData com EcoSistema Hadoop (40h)  Treinamento Apache Sqoop (8h)  Treinamento Apache Cassandra (16h)  Treinamento HBase (16h)  Treinamento Hive (16h)  Treimento Mahout (16h)  Curso + Treinamento em BI aplicado a máquinas de aprendizado Mahout (30h)  Curso de Splunk (16h)  Curso Pig e Pig Latin (16h)  Curos de Programaçao em MapReduce com Java e C# (16h)  Curso de Flume (16h)