SlideShare une entreprise Scribd logo
CHP1 :
INTRODUCTION
Approche et Vocabulaire
Youssef CHOUNI
Slide 1
2
Introduction aux Big Data
• Chaque jour, nous générons 2,5 trillions d’octets de
données
• 90% des données dans le monde ont été créées au
cours des deux dernières années
• 90% des données générées sont non structurées
• Source:
 Capteurs utilisés pour collecter les informations climatiques
 Messages sur les médias sociaux
 Images numériques et vidéos publiées en ligne
 Enregistrements transactionnels d’achat en ligne
 Signaux GPS de téléphones mobiles
 …
• Données appelées Big Data ou Données Massives
3
• Chefs d’entreprise prennent fréquemment des
décisions basées sur des informations en
lesquelles ils n’ont pas confiance, ou qu’ils
n’ont pas
• Chefs d’entreprise disent qu’ils n’ont pas
accès aux informations dont ils ont besoin
pour faire leur
travail
• Des DSI (Directeurs des SI) citent : «
L’informatique décisionnelle et analytique »
commefaisant partie de leurs plans pour
améliorer leur compétitivité
• Des PDG ont besoin d’améliorer la capture et
la compréhension des informations pour
prendre des décisions plus rapidement
1/3
1/ 2
83%
60%
Introduction aux Big Data
• Sources multiples: sites, bases de données,
téléphones, serveurs:
 Détecter les sentiments et réactions des clients
 Détecter les conditions critiques ou potentiellement
mortelles dans les hôpitaux , et à temps pour intervenir
 Prédire des modèles météorologiques pour planifier l’usage
optimal des éoliennes
 Prendre des décisions risquées basées sur des données
transactionnelles en temps réel
 Identifier les criminels et les menaces à partir de vidéos,
sons et flux de données
 Étudier les réactions des étudiants pendant un cour, prédire
ceux qui vont réussir, d’après les statistiques et modèles
réunis au long des années
(domaine Big Data in Education)
INTRODUCTION AUX BIG DATA
4
• Réunir un grand volume de données variées pour
trouver de nouvelles idées
• Capturer des données créées rapidement
• Sauvegarder toutes ces données
• Traiter ces données et les utiliser
INTRODUCTION AUX BIG DATA
5
• Extraction d’informations et décisions à partir
de données, caractérisées par les 5 V:
 Volume (Volume)
 Variété (Variety)
 Vitesse (Velocity)
 Véracité (Veracity)
 Valeur (Value)
INTRODUCTION AUX BIG DATA
6
5 Vs du
BigData
Volume Vitesse
Valeur
Variété
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
7
• Le prix de stockage des données a beaucoup diminué ces
30 dernières années:
 De $100,000 / Go (1980)
 À $0.10 / Go (2013)
• Les lieux de stockage fiables (comme des SAN: Storage
Area Network) ou réseaux de stockage peuvent être très
coûteux
 Choisir de ne stocker que certaines données, j
ugées sensibles
 Perte de données, pouvant être très utiles, comme
les logs
• Comment déterminer les données qui méritent d’être
stockées?
 Transactio ns? Logs? Métier? Utilisateur?
Capteurs? Médicales? Sociales?
 Aucune donnée n’est inutile. Certaines n’ont juste pas
encore servi.
• Problèmes:
 Comment stocker les données dans un endroit
fiable, qui soit moins cher
 Comment parcourir ces données et en
extraire des info rmations facilement et
rapidement?
Introduction aux Big Data
- ²
Volume Vitesse
Valeur
Variété
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
8
• Pour un stockage dans des bases de données ou dans des
entrepôts de données, les données doivent respecter un
format prédéfini.
• La plupart des données existantes sont non- structurées
ou semi-structurées
• Données sous plusieurs formats et types
• On veut tout stocker:
 Exemple: pour une discussion dans un centre
d’appel, on peut la stocker sous forme textuelle
pour son contenu, comme on peut stocker
l’enregistrement en entier, pour interpréter le ton de
voix du client
• Certaines données peuvent paraître obsolètes, mais sont
utiles pour certaines décisions:
 Exemple: Pour le transport de marchandise, on a
tendance à choisir le camion le plus proche. Mais
parfois, ce n’est pas la meilleure solution. D’autres
problèmes peuvent intervenir.
 Besoin de : Données GPS, Plan de livraison du
camion, Circulation, Chargement du camion, Niveau
d’essence…
Introduction aux Big Data
5 Vs du
BigData
Volume Vitesse
Valeur
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
Vitesse
Valeur
Volume
Véracité
9
• Rapidité d’arrivée des données
• Vitesse de traitement
• Les données doivent être stockées
à l’arrivée, parfois même des
Teraoctets par jour
 Sinon, risque de perte
d’informations
• Exemple
 Il ne suffit pas de savoir quel
article un client a acheté ou
réservé
 Si si on sait que vous avez
passé plus de 5mn à consulter
un article dans une boutique
d’achat en ligne, il est possible
de vous envoyer un email dès
que cet article est soldé.
Introduction aux Big Data
- 5 Vs du
Big
Data
Volume Vitesse
Valeur
Variété
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
Valeur
Variété
Véracité
Volume
10
• Cela fait référence au désordre ou la
fiabilité des données. Avec
l’augmentation de la quantité, la
qualité et précision se
perdent (abréviations, typos,
déformations, source peu fiable…)
• Les solutions Big Data doivent remédier
à cela en se référant au volume des
données existantes
• Nécessité d’une (très) grande
rigueur dans l’organisation de la
collecte et le recoupement,
croisement, enrichissement des
données pour lever l’incertitude et
la nature imprévisible des données
introduites dans les modèles mais
aussi pour respecter le cadre légal
pour créer la confiance et garantir la
sécurité et l’intégrité des données.
Introduction aux Big Data
5 Vs du
BigData
Volume Vitesse
Valeur
Variété
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
Valeur
Variété
Volume Vitesse
• Le V le plus important
• Il faut transformer toutes les
données en valeurs
exploitables: les données
sans valeur sont inutiles
• Atteindre des objectifs
stratégiques de création de
valeur pour les clients et
pour l’entreprise dans tous
les domaines d’activité
INTRODUCTION AUX BIG DATA
11
5 Vs du
BigData
Volume Vitesse
Valeur
Variété
Véracité
- Téraoctets
- Enreg. / Archives
- Transactions
- Tables, fichiers
- Batch
- Temps réél
- Processus
- Flot dedonnées
- Statistiques
- Évènements
- Corrélations
- Hypothétiques
- Confiance
- Authenticité
- Origine, réputation
- Disponibilité
- Responsabilité
- Structurées
- Non structurées
- Multi-facteur
- Probabilistes
Vitesse
Variété
Volume
Véracité
Valeur
12
Introduction aux Big Data
De nouvelles exigences
nécessitent une nouvelle
conception et construction
Les besoins métier guident la conception de la solution
Le responsable métier définit
les besoins : Quelles
questions doit-on poser?
IT conçoit une solution avec un
ensemble de structures et
fonctionnalités
Le responsable métier exécute les
requêtes pour répondre aux
questions – encore et encore
• Appropriée pour:
 Des données structurées
 Opérations et processus répétitifs
 Sources relativement stables
 Besoins bien compris et bien cadrés
INTRODUCTION AUX BIG DATA
13
14
IntroductionauxBigData
Les sources d’information guident la découverte créative
Le responsable métier et IT
identifient les sources de données
disponibles
Denouvelles idées conduisent à
l’intégration de technologies
traditionnelles
IT fournit une plateforme
qui permet une
exploration créative de
toutes les données
disponibles
Le responsable métier détermine
les questions à poser en
explorant les données et
relations entre elles
• La question n’est pas :
 Dois-je choisir entre
l’approche classique et
l’approche Big Data?
• Mais plutôt:
 Comment les faire
fonctionner
ensemble?
INTRODUCTION AUX BIG DATA
15
Entrepôt de Données Plateforme Big Data
Sources Traditionnelles
Nouvelles Sources
Approche Big Data
Analyse Itérative et Exploratoire
Responsables Métier
Déterminent quelles
questions poser
APPROCHE BIG DATA VS APPROCHE TRADITIONNELLE
16
Responsables IT
Structurent les données
pour répondre à ces
questions
Responsables IT
Fournissent une
plateforme pour
permettre la
découverte créative
Responsables Métier
Explorent la plateforme
pour déterminer
quelles
questions poser
Introduction aux Big Data
Approche Traditionnelle
Analyse Structurée et Répétée

Contenu connexe

PDF
BigData_Chp1: Introduction à la Big Data
PPTX
Ecosystème Big Data
PDF
Big data.pdf la programmation système et la robotique
PDF
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
PDF
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
PDF
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
PDF
690992112-Big-Data-chap-1-introduction.pdf
PDF
Morning Tech#1 BigData - Oxalide Academy
BigData_Chp1: Introduction à la Big Data
Ecosystème Big Data
Big data.pdf la programmation système et la robotique
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
Arrow Group: Techday Big Data - Etat et Enjeu pour l'Assurance
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
690992112-Big-Data-chap-1-introduction.pdf
Morning Tech#1 BigData - Oxalide Academy

Similaire à introduction bigdata (20)

PPTX
7 points clés à retenir pour aborder le data management de données clients...
PDF
BigData selon IBM
PPTX
CustoQuestion #19: Le DataLake
PDF
Workshop - Monétisation de la Donnée : Process & Exemples
PDF
Business intelligence pour startups
PDF
La Banque de demain : Chapitre 4
PDF
Livre Blanc : comprendre les data-lakes
PPTX
webinar180520171-jhkkjh170518113247.pptx
PDF
Quel est l'avenir des stratégies de données?
PDF
Etude sur le Big Data
PPTX
Parcours Big Data @ Cetic (6 mai 2014)
PPTX
L'utilisation du Big Data en entreprise
PPTX
Big Data Des méandres des outils au potentiel business
PDF
IBM Data lake
PDF
Introduction à la BIG DATA et l'Intelligence Artificielle
PPTX
Introduction à la big data v3
PPSX
SUITE-BIG-DATA-COURS-3rd-computer-science-FSSM
PDF
telecharger cours pdf pour Datawarehose.pdf
PDF
Point de vue expert: la stratégie “ comptoir des données”
PPSX
786231075-Cours-Big-DataDataDataData.ppsx
7 points clés à retenir pour aborder le data management de données clients...
BigData selon IBM
CustoQuestion #19: Le DataLake
Workshop - Monétisation de la Donnée : Process & Exemples
Business intelligence pour startups
La Banque de demain : Chapitre 4
Livre Blanc : comprendre les data-lakes
webinar180520171-jhkkjh170518113247.pptx
Quel est l'avenir des stratégies de données?
Etude sur le Big Data
Parcours Big Data @ Cetic (6 mai 2014)
L'utilisation du Big Data en entreprise
Big Data Des méandres des outils au potentiel business
IBM Data lake
Introduction à la BIG DATA et l'Intelligence Artificielle
Introduction à la big data v3
SUITE-BIG-DATA-COURS-3rd-computer-science-FSSM
telecharger cours pdf pour Datawarehose.pdf
Point de vue expert: la stratégie “ comptoir des données”
786231075-Cours-Big-DataDataDataData.ppsx

Dernier (20)

PPTX
Presentation_carte_arduino_uno_1_Entree_Sortie_numerique.pptx
PDF
CLASE 5 comparatifs en gfrnacaise clase 2
PDF
Bac 2026 - Livre - 🎤 Le Grand Oral - ✍️Exemples rédigés - Spécialité: 💻 NSI -...
PDF
CLASE 2 TRAIN voacublaire en rancaise.pdf
PPTX
Copie de Présentation Personal Branding J2025.pptx_20250610_120558_0000.pptx
PPTX
SESSION1-SUPPORT-DE-COURS-FLEC-(Future leader en énergie au Cameroun)-CECOSDA...
PDF
Présentation de jfjjfnflfkfkfkhdbhdhhdhd
PDF
Formation SSIAP _ Gestion et contrôle .pdf
PPTX
Le rendez-vous de l'été.pptx Film français
DOC
Vocabulaire pour la description II - Francais Free Lesson-
PDF
Articles definis et indefinis. Comment les différencier ?
PPTX
Présentation Projet Entreprise Minimaliste Moderne Sobre Blanc Noir.pptx
PPTX
SESSION4-SUPPORT-DE-COURS-FLEC-(Future leader en énergie au Cameroun)-CECOSDA...
PPT
le-subjonctif-présent, Grammaire, français
PPTX
XEROPHTALMIE , SES ETIOLOGIES ET SA PRISE EN CHARGE
PPTX
Le rendez-vous de l'été.pptx Film français
PPT
Les moyens de transport-2023.ppt french language teaching ppt
PPT
étude----- droit------ 2005---------.ppt
PDF
Consignes générales sécurité et environnement.pdf
DOC
Le verbe avoir- Free francais lesson-free
Presentation_carte_arduino_uno_1_Entree_Sortie_numerique.pptx
CLASE 5 comparatifs en gfrnacaise clase 2
Bac 2026 - Livre - 🎤 Le Grand Oral - ✍️Exemples rédigés - Spécialité: 💻 NSI -...
CLASE 2 TRAIN voacublaire en rancaise.pdf
Copie de Présentation Personal Branding J2025.pptx_20250610_120558_0000.pptx
SESSION1-SUPPORT-DE-COURS-FLEC-(Future leader en énergie au Cameroun)-CECOSDA...
Présentation de jfjjfnflfkfkfkhdbhdhhdhd
Formation SSIAP _ Gestion et contrôle .pdf
Le rendez-vous de l'été.pptx Film français
Vocabulaire pour la description II - Francais Free Lesson-
Articles definis et indefinis. Comment les différencier ?
Présentation Projet Entreprise Minimaliste Moderne Sobre Blanc Noir.pptx
SESSION4-SUPPORT-DE-COURS-FLEC-(Future leader en énergie au Cameroun)-CECOSDA...
le-subjonctif-présent, Grammaire, français
XEROPHTALMIE , SES ETIOLOGIES ET SA PRISE EN CHARGE
Le rendez-vous de l'été.pptx Film français
Les moyens de transport-2023.ppt french language teaching ppt
étude----- droit------ 2005---------.ppt
Consignes générales sécurité et environnement.pdf
Le verbe avoir- Free francais lesson-free

introduction bigdata

  • 1. CHP1 : INTRODUCTION Approche et Vocabulaire Youssef CHOUNI Slide 1
  • 2. 2 Introduction aux Big Data • Chaque jour, nous générons 2,5 trillions d’octets de données • 90% des données dans le monde ont été créées au cours des deux dernières années • 90% des données générées sont non structurées • Source:  Capteurs utilisés pour collecter les informations climatiques  Messages sur les médias sociaux  Images numériques et vidéos publiées en ligne  Enregistrements transactionnels d’achat en ligne  Signaux GPS de téléphones mobiles  … • Données appelées Big Data ou Données Massives
  • 3. 3 • Chefs d’entreprise prennent fréquemment des décisions basées sur des informations en lesquelles ils n’ont pas confiance, ou qu’ils n’ont pas • Chefs d’entreprise disent qu’ils n’ont pas accès aux informations dont ils ont besoin pour faire leur travail • Des DSI (Directeurs des SI) citent : « L’informatique décisionnelle et analytique » commefaisant partie de leurs plans pour améliorer leur compétitivité • Des PDG ont besoin d’améliorer la capture et la compréhension des informations pour prendre des décisions plus rapidement 1/3 1/ 2 83% 60% Introduction aux Big Data
  • 4. • Sources multiples: sites, bases de données, téléphones, serveurs:  Détecter les sentiments et réactions des clients  Détecter les conditions critiques ou potentiellement mortelles dans les hôpitaux , et à temps pour intervenir  Prédire des modèles météorologiques pour planifier l’usage optimal des éoliennes  Prendre des décisions risquées basées sur des données transactionnelles en temps réel  Identifier les criminels et les menaces à partir de vidéos, sons et flux de données  Étudier les réactions des étudiants pendant un cour, prédire ceux qui vont réussir, d’après les statistiques et modèles réunis au long des années (domaine Big Data in Education) INTRODUCTION AUX BIG DATA 4
  • 5. • Réunir un grand volume de données variées pour trouver de nouvelles idées • Capturer des données créées rapidement • Sauvegarder toutes ces données • Traiter ces données et les utiliser INTRODUCTION AUX BIG DATA 5
  • 6. • Extraction d’informations et décisions à partir de données, caractérisées par les 5 V:  Volume (Volume)  Variété (Variety)  Vitesse (Velocity)  Véracité (Veracity)  Valeur (Value) INTRODUCTION AUX BIG DATA 6 5 Vs du BigData Volume Vitesse Valeur Variété Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes
  • 7. 7 • Le prix de stockage des données a beaucoup diminué ces 30 dernières années:  De $100,000 / Go (1980)  À $0.10 / Go (2013) • Les lieux de stockage fiables (comme des SAN: Storage Area Network) ou réseaux de stockage peuvent être très coûteux  Choisir de ne stocker que certaines données, j ugées sensibles  Perte de données, pouvant être très utiles, comme les logs • Comment déterminer les données qui méritent d’être stockées?  Transactio ns? Logs? Métier? Utilisateur? Capteurs? Médicales? Sociales?  Aucune donnée n’est inutile. Certaines n’ont juste pas encore servi. • Problèmes:  Comment stocker les données dans un endroit fiable, qui soit moins cher  Comment parcourir ces données et en extraire des info rmations facilement et rapidement? Introduction aux Big Data - ² Volume Vitesse Valeur Variété Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes
  • 8. 8 • Pour un stockage dans des bases de données ou dans des entrepôts de données, les données doivent respecter un format prédéfini. • La plupart des données existantes sont non- structurées ou semi-structurées • Données sous plusieurs formats et types • On veut tout stocker:  Exemple: pour une discussion dans un centre d’appel, on peut la stocker sous forme textuelle pour son contenu, comme on peut stocker l’enregistrement en entier, pour interpréter le ton de voix du client • Certaines données peuvent paraître obsolètes, mais sont utiles pour certaines décisions:  Exemple: Pour le transport de marchandise, on a tendance à choisir le camion le plus proche. Mais parfois, ce n’est pas la meilleure solution. D’autres problèmes peuvent intervenir.  Besoin de : Données GPS, Plan de livraison du camion, Circulation, Chargement du camion, Niveau d’essence… Introduction aux Big Data 5 Vs du BigData Volume Vitesse Valeur Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes Vitesse Valeur Volume Véracité
  • 9. 9 • Rapidité d’arrivée des données • Vitesse de traitement • Les données doivent être stockées à l’arrivée, parfois même des Teraoctets par jour  Sinon, risque de perte d’informations • Exemple  Il ne suffit pas de savoir quel article un client a acheté ou réservé  Si si on sait que vous avez passé plus de 5mn à consulter un article dans une boutique d’achat en ligne, il est possible de vous envoyer un email dès que cet article est soldé. Introduction aux Big Data - 5 Vs du Big Data Volume Vitesse Valeur Variété Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes Valeur Variété Véracité Volume
  • 10. 10 • Cela fait référence au désordre ou la fiabilité des données. Avec l’augmentation de la quantité, la qualité et précision se perdent (abréviations, typos, déformations, source peu fiable…) • Les solutions Big Data doivent remédier à cela en se référant au volume des données existantes • Nécessité d’une (très) grande rigueur dans l’organisation de la collecte et le recoupement, croisement, enrichissement des données pour lever l’incertitude et la nature imprévisible des données introduites dans les modèles mais aussi pour respecter le cadre légal pour créer la confiance et garantir la sécurité et l’intégrité des données. Introduction aux Big Data 5 Vs du BigData Volume Vitesse Valeur Variété Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes Valeur Variété Volume Vitesse
  • 11. • Le V le plus important • Il faut transformer toutes les données en valeurs exploitables: les données sans valeur sont inutiles • Atteindre des objectifs stratégiques de création de valeur pour les clients et pour l’entreprise dans tous les domaines d’activité INTRODUCTION AUX BIG DATA 11 5 Vs du BigData Volume Vitesse Valeur Variété Véracité - Téraoctets - Enreg. / Archives - Transactions - Tables, fichiers - Batch - Temps réél - Processus - Flot dedonnées - Statistiques - Évènements - Corrélations - Hypothétiques - Confiance - Authenticité - Origine, réputation - Disponibilité - Responsabilité - Structurées - Non structurées - Multi-facteur - Probabilistes Vitesse Variété Volume Véracité Valeur
  • 12. 12 Introduction aux Big Data De nouvelles exigences nécessitent une nouvelle conception et construction Les besoins métier guident la conception de la solution Le responsable métier définit les besoins : Quelles questions doit-on poser? IT conçoit une solution avec un ensemble de structures et fonctionnalités Le responsable métier exécute les requêtes pour répondre aux questions – encore et encore
  • 13. • Appropriée pour:  Des données structurées  Opérations et processus répétitifs  Sources relativement stables  Besoins bien compris et bien cadrés INTRODUCTION AUX BIG DATA 13
  • 14. 14 IntroductionauxBigData Les sources d’information guident la découverte créative Le responsable métier et IT identifient les sources de données disponibles Denouvelles idées conduisent à l’intégration de technologies traditionnelles IT fournit une plateforme qui permet une exploration créative de toutes les données disponibles Le responsable métier détermine les questions à poser en explorant les données et relations entre elles
  • 15. • La question n’est pas :  Dois-je choisir entre l’approche classique et l’approche Big Data? • Mais plutôt:  Comment les faire fonctionner ensemble? INTRODUCTION AUX BIG DATA 15 Entrepôt de Données Plateforme Big Data Sources Traditionnelles Nouvelles Sources
  • 16. Approche Big Data Analyse Itérative et Exploratoire Responsables Métier Déterminent quelles questions poser APPROCHE BIG DATA VS APPROCHE TRADITIONNELLE 16 Responsables IT Structurent les données pour répondre à ces questions Responsables IT Fournissent une plateforme pour permettre la découverte créative Responsables Métier Explorent la plateforme pour déterminer quelles questions poser Introduction aux Big Data Approche Traditionnelle Analyse Structurée et Répétée