SlideShare a Scribd company logo
Workshop Framework tecnologici
per i Big data
Andrea Gioia
27/6/2016
Osservatorio Big Data del Politecnico di Milano
Il mondo che conosciamo
EAI: SOA (WS + ESB)
Data storage: Relazionali (OLAP + DWH)
Landscape applicativo: Applicazioni mature e
consolidate nel tempo
Il futuro non è più (solo) quello di una
volta
Persone (Social)
Organizzazioni (Data
Monetization, Open
Data)
Cose (IoT)
Chi produce i dati?Lungo quali dimensioni cresce la
complessità?
Il mondo che verrà
EAI: Microservices
Data storage: Relazionali (OLAP + DWH)
Landscape applicativo: In continua evoluzione
Un mondo ricco di opportunità…
…per chi sa coglierle
Martec’s Law
Rimanere fermi è un rischio
Le nuove tecnologie sebbene
spesso immature crescono a
ritmi esponenziali (technology
trigger). Se ben impiegate
possono garantire un
incremento incredibile di
vantaggio competitivo
(disruptive innovation)
Le vecchie tecnologie
sebbene consolidate crescono
poco (plateau of
productivity). Anche se
utilizzate al meglio
garantiscono un incremento
marginale di vantaggio
competitivo (incremental
innovation)
L’esempio (negativo) di Kodak
Come gestire la complessità
Data Bus (es.Kafka)
Data
System
Data
System
Data
System
Data
System
App App
Spaghetti Architecture Data Bus Architecture
Data lake e data river
Senza un data river il data lake diventa ben presto una
palude
Il data lake e il dwh
Data Lake
1. Dati non aggregati
2. Dati Strutturati e non
3. Computazione batch
DWH
1. Dati aggregati
2. Dati Strutturati
3. Computazione online
Uno non sostituisce
l’altro.
Data Bus
Data
Lake
DWH
Data governance
• L’importanza della qualità del dato rimane
centrale (l’ETL non è morto)
• Metadati nel data river per l’interazione tra le
componenti (schema registry) e data lineage
• Metadati nel DL per il data discovery
(informed data lake)
Conclusioni
• Non rimanere fermi
• Data platform (data bus e data governance)
• Processo agile (iterazioni corte, MVC e non
temere di svoltare quando serve)
• Sperimentare nuove strade (disruptive
innovation vs incremental innovation)
• Selezionare con cura i propri compagni di
viaggio
GRAZIE!
@andrea_gioia
andrea.gioia@quantyca.it
@quantycabi
www.quantyca.it

More Related Content

PPTX
Superare gli ostacoli nella trasformazione digitale
PPTX
Cloud Computing 2010 - Nextvalue - Alfredo Gatti
PPTX
Change is the New Normal - Architetture per una nuova Data Strategy
PPT
XI UNDICESIMO SALONE DIMPRESA IBM Ferdinando Polato La leggerezza secondo IBM
PPT
Welcome
PDF
Marco De Rossi - Imprenditorialità e formazione online: Oil Project
PDF
Nextvalue Ricerca Cloud Computing in Italia e in Europa - Ed. 2010
PPTX
Legacy Transformation for Business Innovation
Superare gli ostacoli nella trasformazione digitale
Cloud Computing 2010 - Nextvalue - Alfredo Gatti
Change is the New Normal - Architetture per una nuova Data Strategy
XI UNDICESIMO SALONE DIMPRESA IBM Ferdinando Polato La leggerezza secondo IBM
Welcome
Marco De Rossi - Imprenditorialità e formazione online: Oil Project
Nextvalue Ricerca Cloud Computing in Italia e in Europa - Ed. 2010
Legacy Transformation for Business Innovation

What's hot (17)

PDF
Generazione IoT: gli agenti del cambiamento secondo Cisco
PPTX
Le nuove professioni del web
PDF
Un chiaro punto di vista
PDF
Data Economy, prospettive di mercato
PDF
GdLENT20 COSA V11
PPTX
Mobile Strategy in Digital Environment: the Mindset Shift
PDF
Design for Industry 4.0
PDF
Il nostro approccio
PDF
Cosa facciamo
PDF
Alberto Degradi - Conferenza Plenaria Mobile Revolution State of the art
PDF
Rifare la manifattura
PDF
Industria 4.0 soluzioni efficienti
PDF
Fab lab e filiere per la nuova manifattura
PDF
Sei gia tra le nuvole?
PDF
Smau Firenze 2016 - Assintel, Wladimiro Bedin
PDF
Smau Firenze 2016 - TIM
PDF
Il Ruolo di una Piattaforma per la Creazione di Soluzioni a Valore
Generazione IoT: gli agenti del cambiamento secondo Cisco
Le nuove professioni del web
Un chiaro punto di vista
Data Economy, prospettive di mercato
GdLENT20 COSA V11
Mobile Strategy in Digital Environment: the Mindset Shift
Design for Industry 4.0
Il nostro approccio
Cosa facciamo
Alberto Degradi - Conferenza Plenaria Mobile Revolution State of the art
Rifare la manifattura
Industria 4.0 soluzioni efficienti
Fab lab e filiere per la nuova manifattura
Sei gia tra le nuvole?
Smau Firenze 2016 - Assintel, Wladimiro Bedin
Smau Firenze 2016 - TIM
Il Ruolo di una Piattaforma per la Creazione di Soluzioni a Valore
Ad

Similar to Framework tecnologici per i Big Data: Data Lake & Data River (20)

ODP
Big data analytics vaccari oct2013
ODP
Big Data Conference Ottobre 2013
PPTX
FANTIN BIG DATA (1)
PPTX
Scegli se guidare la trasformazione digitale o subirla
PPTX
Architetture informatiche, media di interazione e nuove tecnologie nel mondo...
PDF
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
PDF
Una finestra sul futuro: il Web 3.0
PDF
L’Enterprise Data Fabric per una gestione agile dei dati
PPTX
Big Data Vs. Open Data
PPT
Bigdata v eletti_nov2013 versione_ampliata_con_silver
PDF
PDF
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
PDF
Conoscenza e promozione del territorio. La IULM per la Basilicata Turistica |...
PPT
Beltrametti+Napoli_LB_12_12_16.ppt
PDF
Introduzione ai Big Data e alla scienza dei dati
PPTX
Presentazione bigdata Madee
PDF
Verso una Spatial Data Science Seminario 29-11-2017
PDF
Informatica Presente e Futuro
PPTX
Big Data per Madee 7 at Digital Accademia
Big data analytics vaccari oct2013
Big Data Conference Ottobre 2013
FANTIN BIG DATA (1)
Scegli se guidare la trasformazione digitale o subirla
Architetture informatiche, media di interazione e nuove tecnologie nel mondo...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
Una finestra sul futuro: il Web 3.0
L’Enterprise Data Fabric per una gestione agile dei dati
Big Data Vs. Open Data
Bigdata v eletti_nov2013 versione_ampliata_con_silver
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Conoscenza e promozione del territorio. La IULM per la Basilicata Turistica |...
Beltrametti+Napoli_LB_12_12_16.ppt
Introduzione ai Big Data e alla scienza dei dati
Presentazione bigdata Madee
Verso una Spatial Data Science Seminario 29-11-2017
Informatica Presente e Futuro
Big Data per Madee 7 at Digital Accademia
Ad

More from Andrea Gioia (11)

PDF
DATA & DRINKS: Data Management Trends.pdf
PDF
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
PDF
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
PDF
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
PDF
I Software passano, i Dati restano.pdf
PDF
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
PPTX
How to integrate legacy systems within a modern polyglot and event driven arc...
PPTX
IT matters once again
PPTX
Fast data platforms - Hadoop User Group (Italy)
PPT
Open Source Location Intelligence with SpagoBI
PPT
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
DATA & DRINKS: Data Management Trends.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
I Software passano, i Dati restano.pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
How to integrate legacy systems within a modern polyglot and event driven arc...
IT matters once again
Fast data platforms - Hadoop User Group (Italy)
Open Source Location Intelligence with SpagoBI
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)

Framework tecnologici per i Big Data: Data Lake & Data River

  • 1. Workshop Framework tecnologici per i Big data Andrea Gioia 27/6/2016 Osservatorio Big Data del Politecnico di Milano
  • 2. Il mondo che conosciamo EAI: SOA (WS + ESB) Data storage: Relazionali (OLAP + DWH) Landscape applicativo: Applicazioni mature e consolidate nel tempo
  • 3. Il futuro non è più (solo) quello di una volta Persone (Social) Organizzazioni (Data Monetization, Open Data) Cose (IoT) Chi produce i dati?Lungo quali dimensioni cresce la complessità?
  • 4. Il mondo che verrà EAI: Microservices Data storage: Relazionali (OLAP + DWH) Landscape applicativo: In continua evoluzione
  • 5. Un mondo ricco di opportunità…
  • 6. …per chi sa coglierle Martec’s Law
  • 7. Rimanere fermi è un rischio Le nuove tecnologie sebbene spesso immature crescono a ritmi esponenziali (technology trigger). Se ben impiegate possono garantire un incremento incredibile di vantaggio competitivo (disruptive innovation) Le vecchie tecnologie sebbene consolidate crescono poco (plateau of productivity). Anche se utilizzate al meglio garantiscono un incremento marginale di vantaggio competitivo (incremental innovation)
  • 9. Come gestire la complessità Data Bus (es.Kafka) Data System Data System Data System Data System App App Spaghetti Architecture Data Bus Architecture
  • 10. Data lake e data river Senza un data river il data lake diventa ben presto una palude
  • 11. Il data lake e il dwh Data Lake 1. Dati non aggregati 2. Dati Strutturati e non 3. Computazione batch DWH 1. Dati aggregati 2. Dati Strutturati 3. Computazione online Uno non sostituisce l’altro. Data Bus Data Lake DWH
  • 12. Data governance • L’importanza della qualità del dato rimane centrale (l’ETL non è morto) • Metadati nel data river per l’interazione tra le componenti (schema registry) e data lineage • Metadati nel DL per il data discovery (informed data lake)
  • 13. Conclusioni • Non rimanere fermi • Data platform (data bus e data governance) • Processo agile (iterazioni corte, MVC e non temere di svoltare quando serve) • Sperimentare nuove strade (disruptive innovation vs incremental innovation) • Selezionare con cura i propri compagni di viaggio