SlideShare uma empresa Scribd logo
TRILHA BIGDATA E NOSQL
Digerindo dados com Apache NiFi
Eliézer Zarpelão
Arquiteto de Software e Professor
Olá!
Arquiteto de Software - ZarpSystem
Professor Universitário - UNAERP
Sistemas de Informação - ICMC/USP
Esp. Engenharia de Software - IC/Unicamp
@eliezerzarpelao
https://www.linkedin.com/in/eliezerzarpelao
https://github.com/elizarp
eliezer.zarpelao@gmail.com
AGENDAAGENDA
Motivação
Porque utilizar Apache NiFi
Estrutura NiFi
Entenda como funciona (componentes e arquitetura)
Demo
Keep calm and show me the flow
Case
Aplicação em healthtech
Motivação
01
DataFlow
Mover conteúdo de “A” para “B”
Logs, HTTP, XML, CSV, Imagens, Vídeos, etc e etc
Logs
Tranquilo….
SQL
maroto BIG DATA
Desafios Big Data
Dados
Padrões
Formatos
Protocolos
Veracidade
Validade
Schemas
Particionamento
Entrega “Exactly Once”
Segurança
Gestão de acesso
Rede
Infraestrutura
Compliance
Pessoa / Time / Grupo
Mudança nos consumidores
Alterações de requisitos
Entrega “Exactly Once”
Pessoas
TDC POA 2020 - Digerindo dados com Apache NiFi
Estrutura
02
10
Apache NiFi
✘ Plataforma open-source para construção e gestão de fluxos de dados
✘ Escalável, segura e tolerante a falhas
✘ Interface Web e API para gestão e monitoramento dos fluxos
✘ Fluxos de dados podem ser alterados em tempo de execução
Flow File
HTTP Header
HTTP Payload
✘ Objeto que se move através do fluxo
✘ Coração do NiFi
✘ Composto por:
○ Atributos (chave/valor)
○ Apontador para conteúdo
11
Processor
✘ Executa um trabalho
✘ Roteamento, transformação...
✘ Mais de 200 componentes...
12
Connections
✘ Conexão entre Processors
✘ Atua como fila
13
Processors
e mais...
Conexão com
Banco de Dados
Gestão de
Cache
(REDIS)
Credenciais
Cloud
ContextMap
HTTP
(API) ...
Controller Service
✘ Recursos compartilhados no fluxo
15
Flow Controller
✘ Orquestra como os processos se conectam e gerencia todas alocações que os processos usam
✘ Atua como broker facilitando a troca de FlowFiles entre os Processors
16
Arquitetura
17
Arquitetura - Cluster
Garantia de
Entrega
Back Pressure
Priorização
de filas
Templates de
fluxos
Data
Provenance
Extensibilidade Escalabilidade Segurança
Funcionalidades
Demo
03
TDC POA 2020 - Digerindo dados com Apache NiFi
Case
04
Motor
de Regras
Case Orizon
API
Monitoramento
Filas
Aprenda mais
Site Oficial: https://nifi.apache.org/
Idéias e sugestões: https://issues.apache.org/jira/browse/nifi
Twitter: @apachenifi
Slack: apachenifi.slack.com
Telegram: https://t.me/nifibrasil
24
Obrigado!
Perguntas??
Repositório: https://github.com/elizarp/tdc-poa-2020-nifi
@eliezerzarpelao
https://www.linkedin.com/in/eliezerzarpelao
https://github.com/elizarp
eliezer.zarpelao@gmail.com

Mais conteúdo relacionado

PDF
2024 Trend Updates: What Really Works In SEO & Content Marketing
PDF
UNAERP - 04/11 - Digerindo dados com Apache NiFi
PDF
ZARP - TechCoffee - Junho 2020 - Apache NiFi
PDF
AI Week Conference BR - MLOps
PDF
Os Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
PDF
Introdução à LGPD - Digital Innovation One
PDF
A importância da Segurança da Informação e os impactos da LGPD
PDF
LGPD - Lei Geral de Protecao de Dados Pessoais
2024 Trend Updates: What Really Works In SEO & Content Marketing
UNAERP - 04/11 - Digerindo dados com Apache NiFi
ZARP - TechCoffee - Junho 2020 - Apache NiFi
AI Week Conference BR - MLOps
Os Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
Introdução à LGPD - Digital Innovation One
A importância da Segurança da Informação e os impactos da LGPD
LGPD - Lei Geral de Protecao de Dados Pessoais

Último (16)

PDF
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
PDF
COBITxITIL-Entenda as diferença em uso governança TI
PPTX
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
PPTX
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
PDF
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
PDF
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
PPTX
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
PDF
Custos e liquidação no SAP Transportation Management, TM130 Col18
PDF
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
PPTX
Arquitetura de computadores - Memórias Secundárias
PDF
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
PDF
Processos na gestão de transportes, TM100 Col18
PDF
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
PDF
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PDF
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
COBITxITIL-Entenda as diferença em uso governança TI
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
Custos e liquidação no SAP Transportation Management, TM130 Col18
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
Arquitetura de computadores - Memórias Secundárias
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
Processos na gestão de transportes, TM100 Col18
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
Anúncio
Anúncio

TDC POA 2020 - Digerindo dados com Apache NiFi