SlideShare une entreprise Scribd logo
Hadoop en Entreprise
Les vraies opportunités aujourd’hui
4 décembre, 2013
Marc-Eric LaRocque
•
•
•
•

Associé principal chez
Consultant depuis 1997
En données et en BI depuis 1994
BI et données mais avec un focus sur
–Gestion de projet et programme
–Stratégie
–Agilité

• MBA, PMP, CBIP et CSM
• Président du Salon BI
Hadoop = Big Data?
Hadoop: cool, mais utile?
Une seule diapositive, promis

POURQUOI PROCIMA EXPERTS?
Pourquoi Procima Experts?

Partenaires

Partenaires

Procima est intégrateur
de solutions Hortonworks

Procima est intégrateur
de solutions Microsoft BI

Partenaires
technologiques
Microsoft HDInsight Server

Hadoop sur Windows Azure
HDInsight, Hadoop et Hortonworks Data Platform

UN PEU DE BACKGROUND
Big Data Microsoft et Hadoop
INSIGHT
Self-Service

Collaboration

Corporate Apps

Devices

DATA ENRICHMENT
Discover

Combine

Refine

DATA
MANAGEMENT
Relational

Non-relational

Analytical

Streaming
Hadoop derrière les couvertes

Stockage distribué
Traitement distribué

“MPP” sur stéroide
Hadoop dans HDInsight
C’est la question qui vaut la peine d’être répondue

POURQUOI HADOOP EST PLUS QUE
COOL, MAIS PEUT ÊTRE UTILE
Cadre d’évaluation

Revenue Generation

Cost Savings

• Archivage de données

• Analyses Exploratoires
• Analyse de Découverte

• Engins de
recommandations
• Analyses de
sentiments
Mais on peut faire tout ceci avec une
BD?
Vrai, mais Hadoop est différent

1. Peut gérer et traiter des volumes
massifs “facilement”. Sans dépenser
une fortune en équipement.
2. Pas une BD*, mais un système de
stockage de fichiers. Donc la structure
est imposée à la lecture

* une BD peu être créée sur HDFS
Structure imposée à la lecture
• Une BD nous force à structurer pour pouvoir insérer
• Structurer requiert
–De l’analyse
–De l’architecture
–Du design
–Du développement “up-front”
–Donc…de l’argent

• Structurer nous force à faire des choix de priorités
• Sans avoir à structurer à l’écriture
–On peut insérer plein de choses sans investissement “up-front”
–On structure au moment ou le besoin d’analyse se manifeste
–Si les données sont accessibles, on est déjà bien partis
Ok, mais…
Pourquoi stocker des données si on
a pas l’intention de les analyser?
Parce que la découverte est nonprévisible

• Analyses Exploratoires
• Analyse de Découverte
Analyse et prédiction
Proposition: Hadoop comme “data lake”
• Amenez les données dans Hadoop autant que possible
• Elles seront dispos au moment ou on en aura besoin pour
analyse de découverte ou autre
• Nous n’auront pas investi dans l’analyse et le design au
début
• Essentiellement, Hadoop comme landing-zone
Le data lake nous supporte l’archivage
aussi

• Archivage de données

• Analyses Exploratoires
• Analyse de Découverte
Parce qu’il en faut, c’est tout

SECTION DES DESSINS TECHNIQUES
Le “data lake”
Insérer toutes les
sources
de données
Data Lake, Data
Reservoir, Landing
Zone, Catch Basin, etc.
Garde les données “en
ligne” longtemps
Peut garder les formats
intermédiaires aussi
Utiliser le data lake
“Cruncher” les données
en-place sans les
transférer ailleurs pour
analyses pointues
En fait, on commence par où exactement?

COMMENT COMMENCER
Pour commencer
1. Comprendre ce qu’est Hadoop
2. Valider le business case possible
3. Valider le cadrage éventuel dans l’architecture
informationnelle
4. Identifier les données et les fonction requises; valider
qu’Hadoop couvre le besoin
5. Assurer que les différences de Hadoop par rapport aux
technologies traditionnelles (RDBMS, appliance, etc.)
sont mises en évidence par le business case choisit –
pas de « trip techno »
6. Émettre un Document de Vision
Document de Vision
•
•
•
•
•
•

Énoncés de problèmes
Fonctionnalités clés attendues
Diagramme de contexte (sources, cible, etc.)
Architecture conceptuelle pour solution éventuelle
Architecture logique pour la PdC
Cas d’utilisation de la solution
–Acteurs, profils d’utilisation
–Envergure des données
–Détail des sources
–Traitements à appliquer à la lecture
–Requêtes à supporter par la PdC
Exécution: la Preuve de concept (5
étapes)
• Analyse et architecture
•
•
•
•
•

Cédule
Kickoff
Revue des besoins
Analyse des données
Conception de l’application

• Installation
• Configuration
• Chargements, mise en place des données
• Mise en place des composantes requises

• Vérification
• Déploiement
• Transition (si la PdC demeure en place)
CONCLUSION
Conseils
•
•
•
•
•
•
•
•

Informez-vous
Soyez supportés
Choisissez un business case clair, de base
Assurez-vous que les bénéfices sont des retombées
AFFAIRES
Commencez par une preuve de concept
Planifiez bien ce que vous désirez prouver
Attachez les bons intervenants
Utilisez Azure et HDInsight pour partir plus rapidement

Contenu connexe

PPT
Prve quetzalli hernandez
PPTX
Números enteros (adición y sustracción)
PPS
España catalogo 2011
PPT
Actividad 2
PPT
Reciclaje y residuos
PDF
Boletin mayo 2012
PDF
Repenser l'équation Formations-Compétences-Compétitivité
PDF
François Fouillet - Ville et CC Partenay Gâtine - Quelle carte de la vie quot...
Prve quetzalli hernandez
Números enteros (adición y sustracción)
España catalogo 2011
Actividad 2
Reciclaje y residuos
Boletin mayo 2012
Repenser l'équation Formations-Compétences-Compétitivité
François Fouillet - Ville et CC Partenay Gâtine - Quelle carte de la vie quot...

En vedette (19)

PPT
La l}udica en las matemáticas
PPTX
Tecnologia
PPTX
Bii oqiimiqaa expo_2 heheh
PPSX
Qué es y para que te va a servir
PPTX
Robots de rehabilitacion
PPTX
Dentwizard, retirer dents de Voiture
PPT
Cinco sentidos
ODP
historia del arte
PPTX
Topologias de redes
PPTX
Cercamiento en la educación superior y en el acceso al conocimiento
PDF
Rapport iggn 2 décembre 2014
PPT
Brasil "O
PPTX
INVITACION
PPT
Profet marzo mhp
PDF
TIC : un enjeu pour la Franche-Comté (rapport CESR, juin 2001)
PPT
Le Guide des secteurs qui recrutent 2014 - 2015
PPTX
Gant Chart
PPTX
Sycomore - IHM / Intégration Continue
La l}udica en las matemáticas
Tecnologia
Bii oqiimiqaa expo_2 heheh
Qué es y para que te va a servir
Robots de rehabilitacion
Dentwizard, retirer dents de Voiture
Cinco sentidos
historia del arte
Topologias de redes
Cercamiento en la educación superior y en el acceso al conocimiento
Rapport iggn 2 décembre 2014
Brasil "O
INVITACION
Profet marzo mhp
TIC : un enjeu pour la Franche-Comté (rapport CESR, juin 2001)
Le Guide des secteurs qui recrutent 2014 - 2015
Gant Chart
Sycomore - IHM / Intégration Continue
Publicité

Similaire à Commencer avec Hadoop (20)

PDF
BigData on change d'ère !
PDF
La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"
PPTX
Hadoop et le big data
PDF
Une Introduction à Hadoop
PPTX
Big data
PPTX
Introduction à Hadoop
PDF
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
PDF
Cours_de_Big_Data_LF2_IG_EbhkjbhkhfhSB.pdf
PDF
Big Data ou comment retrouver une aiguille dans une botte de foin
TXT
Aqui hadoop draft
PDF
Hadoop en 1461 leçons
PPTX
Presentation Hadoop Québec
PDF
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
PDF
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
PDF
Plongée dans la plateforme hadoop
PDF
Alphorm.com Formation Big Data & Hadoop : Le Guide Complet
PPTX
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
PPSX
BigData BigBuzz @ Le Node
PPTX
Big Data Visualization PowerPoint Templates.pptx
PPTX
Big data
BigData on change d'ère !
La Duck Conf 2018 : "Superbe maison d'architecte avec vue sur le lac"
Hadoop et le big data
Une Introduction à Hadoop
Big data
Introduction à Hadoop
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
Cours_de_Big_Data_LF2_IG_EbhkjbhkhfhSB.pdf
Big Data ou comment retrouver une aiguille dans une botte de foin
Aqui hadoop draft
Hadoop en 1461 leçons
Presentation Hadoop Québec
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plongée dans la plateforme hadoop
Alphorm.com Formation Big Data & Hadoop : Le Guide Complet
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
BigData BigBuzz @ Le Node
Big Data Visualization PowerPoint Templates.pptx
Big data
Publicité

Plus de Marc-Eric LaRocque (9)

PPTX
Présentation organismes 8 octobre 2014
PPTX
Procima Experts at Salon BI Analytique 2014 - Stratégie & Roadmap, cas Sanimax
PPTX
Infopresse 14 mai 2014 v1.0
PPTX
Procima deck 7 May 2014
PPTX
14Mar14 Tendances big data HEC - v1.2
PPTX
19 fév 2014 Tendances Big Data - v1.0
PPTX
Presentation BI Adoption - February 5, 2014
PDF
Lunch learn 5 sep2013
PPTX
Agile Data Warehousing - 7 pillars - Procima Experts
Présentation organismes 8 octobre 2014
Procima Experts at Salon BI Analytique 2014 - Stratégie & Roadmap, cas Sanimax
Infopresse 14 mai 2014 v1.0
Procima deck 7 May 2014
14Mar14 Tendances big data HEC - v1.2
19 fév 2014 Tendances Big Data - v1.0
Presentation BI Adoption - February 5, 2014
Lunch learn 5 sep2013
Agile Data Warehousing - 7 pillars - Procima Experts

Commencer avec Hadoop

  • 1. Hadoop en Entreprise Les vraies opportunités aujourd’hui 4 décembre, 2013
  • 2. Marc-Eric LaRocque • • • • Associé principal chez Consultant depuis 1997 En données et en BI depuis 1994 BI et données mais avec un focus sur –Gestion de projet et programme –Stratégie –Agilité • MBA, PMP, CBIP et CSM • Président du Salon BI
  • 3. Hadoop = Big Data?
  • 5. Une seule diapositive, promis POURQUOI PROCIMA EXPERTS?
  • 6. Pourquoi Procima Experts? Partenaires Partenaires Procima est intégrateur de solutions Hortonworks Procima est intégrateur de solutions Microsoft BI Partenaires technologiques Microsoft HDInsight Server Hadoop sur Windows Azure
  • 7. HDInsight, Hadoop et Hortonworks Data Platform UN PEU DE BACKGROUND
  • 8. Big Data Microsoft et Hadoop INSIGHT Self-Service Collaboration Corporate Apps Devices DATA ENRICHMENT Discover Combine Refine DATA MANAGEMENT Relational Non-relational Analytical Streaming
  • 9. Hadoop derrière les couvertes Stockage distribué Traitement distribué “MPP” sur stéroide
  • 11. C’est la question qui vaut la peine d’être répondue POURQUOI HADOOP EST PLUS QUE COOL, MAIS PEUT ÊTRE UTILE
  • 12. Cadre d’évaluation Revenue Generation Cost Savings • Archivage de données • Analyses Exploratoires • Analyse de Découverte • Engins de recommandations • Analyses de sentiments
  • 13. Mais on peut faire tout ceci avec une BD?
  • 14. Vrai, mais Hadoop est différent 1. Peut gérer et traiter des volumes massifs “facilement”. Sans dépenser une fortune en équipement. 2. Pas une BD*, mais un système de stockage de fichiers. Donc la structure est imposée à la lecture * une BD peu être créée sur HDFS
  • 15. Structure imposée à la lecture • Une BD nous force à structurer pour pouvoir insérer • Structurer requiert –De l’analyse –De l’architecture –Du design –Du développement “up-front” –Donc…de l’argent • Structurer nous force à faire des choix de priorités • Sans avoir à structurer à l’écriture –On peut insérer plein de choses sans investissement “up-front” –On structure au moment ou le besoin d’analyse se manifeste –Si les données sont accessibles, on est déjà bien partis
  • 16. Ok, mais… Pourquoi stocker des données si on a pas l’intention de les analyser?
  • 17. Parce que la découverte est nonprévisible • Analyses Exploratoires • Analyse de Découverte
  • 19. Proposition: Hadoop comme “data lake” • Amenez les données dans Hadoop autant que possible • Elles seront dispos au moment ou on en aura besoin pour analyse de découverte ou autre • Nous n’auront pas investi dans l’analyse et le design au début • Essentiellement, Hadoop comme landing-zone
  • 20. Le data lake nous supporte l’archivage aussi • Archivage de données • Analyses Exploratoires • Analyse de Découverte
  • 21. Parce qu’il en faut, c’est tout SECTION DES DESSINS TECHNIQUES
  • 22. Le “data lake” Insérer toutes les sources de données Data Lake, Data Reservoir, Landing Zone, Catch Basin, etc. Garde les données “en ligne” longtemps Peut garder les formats intermédiaires aussi
  • 23. Utiliser le data lake “Cruncher” les données en-place sans les transférer ailleurs pour analyses pointues
  • 24. En fait, on commence par où exactement? COMMENT COMMENCER
  • 25. Pour commencer 1. Comprendre ce qu’est Hadoop 2. Valider le business case possible 3. Valider le cadrage éventuel dans l’architecture informationnelle 4. Identifier les données et les fonction requises; valider qu’Hadoop couvre le besoin 5. Assurer que les différences de Hadoop par rapport aux technologies traditionnelles (RDBMS, appliance, etc.) sont mises en évidence par le business case choisit – pas de « trip techno » 6. Émettre un Document de Vision
  • 26. Document de Vision • • • • • • Énoncés de problèmes Fonctionnalités clés attendues Diagramme de contexte (sources, cible, etc.) Architecture conceptuelle pour solution éventuelle Architecture logique pour la PdC Cas d’utilisation de la solution –Acteurs, profils d’utilisation –Envergure des données –Détail des sources –Traitements à appliquer à la lecture –Requêtes à supporter par la PdC
  • 27. Exécution: la Preuve de concept (5 étapes) • Analyse et architecture • • • • • Cédule Kickoff Revue des besoins Analyse des données Conception de l’application • Installation • Configuration • Chargements, mise en place des données • Mise en place des composantes requises • Vérification • Déploiement • Transition (si la PdC demeure en place)
  • 29. Conseils • • • • • • • • Informez-vous Soyez supportés Choisissez un business case clair, de base Assurez-vous que les bénéfices sont des retombées AFFAIRES Commencez par une preuve de concept Planifiez bien ce que vous désirez prouver Attachez les bons intervenants Utilisez Azure et HDInsight pour partir plus rapidement