Construindo um Data Lake
e democratizando os dados
empresa a fora
Daniel Cassiano
Head of Data @ luizalabs
@danielcassiano
Agenda
● Desafio
● Processo
● Arquitetura
● Democratizando os dados
● Perguntas
O desafio
● Habilitar a empresa para consumir dados
● Acurácia das informações
● Fonte única da verdade
● Formatos plugáveis
● Diversas fontes de dados
● Analytics + Data Science + Business + Marketing
O desafio - sources
● Pipelines de dados recorrentes
● Priorização do tempo de atualização (D-X)
● Formatos plugáveis/acessíveis (json, csv, SQL, ...)
● Validação dos dados (unit and value tests)
● Reprocessamento automatizado
Processo
● Simples é melhor do que complexo
● Acessível é melhor do que inacessível
● Acurácia é tudo
● Documentação e didática fazem diferença
● Governança gera confiança
Premissas
Data Lake?
Data Lake!
Arquitetura simplificada
Arquitetura
Democratizando os dados
● +200 pessoas acessando os dados (vários níveis)
● ~20TB de dados
● Dados NRT até D-7
● 1 ano e meio de vida
Democratizando os dados
● Documentação
● Queries/extrações prontas e exemplos
● Ferramentas de visualização
● Confiança nos dados
● Data Engineering + Business
Democratizando os dados
Perguntas?
Estamos contratando!
bit.ly/vagaluizalabs
Obrigado!
luizalabs.com
magazineluiza.com.br
Daniel Cassiano
Head of Data @ luizalabs
@danielcassiano

Mais conteúdo relacionado

PDF
TDC2018SP | Trilha Arq Dados - Gestao de Dados: Como ter entrega e integracao...
ODP
13 banco-de-dados
PPTX
Arquitetura de banco de dados
PPTX
Big Data, NoSQL e In Memory Databases
PDF
Big data
PPTX
Spring Data com MongoDB
PDF
TDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.com
TDC2018SP | Trilha Arq Dados - Gestao de Dados: Como ter entrega e integracao...
13 banco-de-dados
Arquitetura de banco de dados
Big Data, NoSQL e In Memory Databases
Big data
Spring Data com MongoDB
TDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.com

Semelhante a Construindo um Data Lake - TDC SP 2018 (20)

PPTX
Carreira do profissional de dados
PPT
Tesi Dados Final
PDF
Big Data - Hadoop
PDF
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
PDF
TDC2017 - Misturando dados com Pentaho para insights mais significativos
PPTX
ILM com PostgreSQL
PPTX
Ecosistema de data warehouse com ferramentas microsoft
PPT
TDC - Planejando data Lake com big data clusters
PDF
Apresentação TDC 2018 - Go e Banco de Dados
PDF
Business Analytics
PDF
TDC São Paulo Online 2020 - trilha Big Data
PDF
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
PDF
Postgres + Azure = Transformando dificuldades em oportunidades
PDF
Como Implementar a Análise de Dados em Tempo Real
PDF
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
PDF
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
PPTX
Lecture 7 :: Ferramentas Case
PDF
Qual é o futuro da estratégia de dados?
PDF
Flisol 2016 fidelis - Curitiba - PR - Brazil
PDF
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
Carreira do profissional de dados
Tesi Dados Final
Big Data - Hadoop
DataOps: da teoria a prática, como realmente se aplica em projetos de BigData
TDC2017 - Misturando dados com Pentaho para insights mais significativos
ILM com PostgreSQL
Ecosistema de data warehouse com ferramentas microsoft
TDC - Planejando data Lake com big data clusters
Apresentação TDC 2018 - Go e Banco de Dados
Business Analytics
TDC São Paulo Online 2020 - trilha Big Data
TDC2018FLN | Trilha Cloud - Postgres + Azure = Transformando dificuldades em ...
Postgres + Azure = Transformando dificuldades em oportunidades
Como Implementar a Análise de Dados em Tempo Real
DataOps, Data Mesh e Data Fabric. Melhores práticas para seu projeto de arqui...
DBA Brasil 2.0: Como o papel e atividades de DBA ficam no contexto da cultura...
Lecture 7 :: Ferramentas Case
Qual é o futuro da estratégia de dados?
Flisol 2016 fidelis - Curitiba - PR - Brazil
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
Anúncio

Último (10)

PDF
Aula top demais para ser olhada por todos
PDF
Introdução à ciência de dados Aula 01.pdf
PPTX
BASES DE DADOS CIENTÍFICAS , metodos e metodologias cientificas .pptx
PDF
DIAGNOSTICO DE AVARIAS EM AUTOMATISMOS INDUSTRIAIS.pdf
PDF
BIOESTATÍSTICA_20250817_143657APRESENTAÇÃO
PDF
Planejamento de pesquisa - ANALISE DE DADOS
PPTX
Obsesidade_e_atividade_fisica em pessoas
PDF
Óptica geométrica - Vidal.pdfhuuuhhuui
PDF
POP-28-Administracao-de-medicacao-intramuscular.pdf
PDF
Inicialização com as bibliotecas pandas e NumpyAula 02.pdf
Aula top demais para ser olhada por todos
Introdução à ciência de dados Aula 01.pdf
BASES DE DADOS CIENTÍFICAS , metodos e metodologias cientificas .pptx
DIAGNOSTICO DE AVARIAS EM AUTOMATISMOS INDUSTRIAIS.pdf
BIOESTATÍSTICA_20250817_143657APRESENTAÇÃO
Planejamento de pesquisa - ANALISE DE DADOS
Obsesidade_e_atividade_fisica em pessoas
Óptica geométrica - Vidal.pdfhuuuhhuui
POP-28-Administracao-de-medicacao-intramuscular.pdf
Inicialização com as bibliotecas pandas e NumpyAula 02.pdf
Anúncio

Construindo um Data Lake - TDC SP 2018