SlideShare une entreprise Scribd logo
BigData | Cloud | Mobile | Security
#BigData… on change d’ère !
Aadel Benyoussef
Excelerate Systems France
Aadel.Benyoussef@ExcelerateSystems.net
+33 (0)5 24 61 56 81
#Innovation
 De Nouvelles Solutions pour
de Vieux Problèmes
 De Nouvelles Solutions pour
de Nouveaux Problèmes
BigData on change d'ère !
#Innovation
 De Nouvelles Solutions pour
de Vieux Problèmes ?
 De Nouvelles Solutions pour
de Nouveaux Problèmes ?
Alors, innovons !
Au début de notre ère numérique…
Informatique d’Entreprise
• Affaire de Spécialistes
• Centralisée
• Inaccessible hors de l’entreprise
Au début de notre ère numérique…
Informatique d’Entreprise
• Affaire de Spécialistes
• Centralisée
• Inaccessible hors de l’entreprise
Informatique Personnelle
• Mac .vs. PC
• Individuelle
• Isolée
Notre environnement Numérique… aujourd’hui !
PC / Mac
Notre environnement Numérique… aujourd’hui !
› Application d’Entreprise
› Bureautique
› Internet
› Email
› Réseaux Sociaux
› Objets connectés
› e-commerce
› Banque en ligne
› Jeux en réseau
› Apps Mobiles
› Sauvegarde et Transport de
données
› Échange / Partage
› … etc.
Cloud
Objets Connectés
Smartphones
Tablettes
Laptop
Hybrydes
PC / Mac
Disques USB
Ajourd’hui, les Entreprises s’intéressent à …
Toutes les données Produites
en Interne et en Externe
… Mais aussi à toutes les données
qui la Concernent !
Source : IBM
Les Entreprises s’intéressent à … Nous !
Les Entreprises s’intéressent à … Nous !
Les 3V qui imposent le changement
- Volume
- Variété
- Vitesse
ÉvolutiondelaDonnées
10% - Données Structurées
1980 2014
90 % - Données Non-Structurées
+3 trillion Go de données créées en 2013…
 Plus de 90% sont des données non structurées
 500 quadrillion de fichiers
1 Trillion = 1018, soit un milliard de milliards.
1 Quadrillion = 1024
Des changements
considérables lors
des 30 dernières
années
Applications Internet
Smartphones &
Tablettes
Machines intelligentes
Capteurs
Quantités
doublent
tous les 2 Ans
En route vers Le Changement
Déterminer
l’environnement
opérationnel
1
En route vers Le Changement
Déterminer
l’environnement
opérationnel
Analyser des
cas d’usages
1 2
En route vers Le Changement
Déterminer
l’environnement
opérationnel
Analyser des
cas d’usages
Identifier les
Compétences
1 2 3
BigBang Hadoop
BigBang Hadoop
Pourquoi utiliser Hadoop ?
• Le moins Couteux (100% OpenSource)
• Pour traiter des Peta-Octets de données
• Le plus Rapide actuellement
• Pour les Traitements Parallèles
• Le Meilleur à ce jour
• Pour apporter des Solutions à tous les problèmes de traitement de
Données Massives
Ecosystèmes
Hadoop
Source : Datameer
+400 Partenaires
Technologies et Services
Les avantages de l'Open Source
au-delà de l’éthique, il est question de :
Facilité d’Adoption
Acquisition et démonstration de la Valeur avec des investissements mesurées1
Les avantages de l'Open Source
au-delà de l’éthique, il est question de :
Facilité d’Adoption
Acquisition et démonstration de la Valeur avec des investissements mesurées1
Innovation et Développement Rapide
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
2
Les avantages de l'Open Source
au-delà de l’éthique, il est question de :
Facilité d’Adoption
Acquisition et démonstration de la Valeur avec des investissements mesurées1
Innovation et Développement Rapide
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
2
Extensibilité
Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie3
Les avantages de l'Open Source
au-delà de l’éthique, il est question de :
Facilité d’Adoption
Acquisition et démonstration de la Valeur avec des investissements mesurées1
Innovation et Développement Rapide
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
2
Extensibilité
Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie3
Pas de dépendance « Editeur »
Pas de données ou processus « propriétaires" – la sélection des fournisseurs uniquement sur la Qualité des Services4
Quelle importance accordez vous, dans la sélection d’un
vendeur de BigData aux critères suivants:
7 8 9
Source: King Research, 3922 Respondents
Evolutivité
Performance
Flexibilité
Fiabilité du vendeur
Technologie Sécurisée
Intégration avec d'autres systèmes
Coût
Techniquement Supérieur aux autres
Logiciel Open Source
BigData on change d'ère !
28
#1Choix de
l’Environnement Opérationnel
Quels sont les éléments qui déterminent votre choix de
fournisseur de solution BigData?
Source: King Research, 3922 Respondents
6 6,5 7 7,5 8 8,5 9
Formations
Services de Consulting
Recommandations
Support Technique
Richesse des Fonctionnalités
0% 20% 40% 60%
Quelles infrastructures pensez-vous améliorer avec des
solutions BigData ?
Source: King Research, 3922 Respondents
Traitements ETL
Bases de Données Analytiques
Stockage
Enterprise Data Warehouse
Système Central (Mainframe)
31
Quels sont les principaux avantages recherchés dans une
solutions BigData d’entreprise
Source: King Research, 3922 Respondents
10% 30% 50% 70%
Amélioration des Analyses de Données
Amélioration du Traitement de Données
Prendre de Meilleures Décisions, Plus Rapidement
Augmenter la Valeur marchande des Données
Améliorer l‘Efficacité Opérationnelle
Acquérir un Avantage Concurrentiel
15% 25% 35% 45%
Quelles sont vos principaux développements d’applications
BigData?
Source: King Research, 3922 Respondents
Recherche / Innovation
Analyse Comportementale
Connaissance des Clients
Ciblage de Marché
Analyse de l‘Expérience Client
Amélioration Opérationnelle
33
#2 Analyser des Cas d’Usages
#BigData en Pratique
Société de Jeux Video
• Succès d’un jeux sur Mobile  Augmentation exponentielle du nombre de joueurs  Lenteurs d’exécution des programmes d’Analyse
comportementales
• la transformation de l'architecture MySQL à vers NoSQL
Choix technique: Hadoop (CDH) sur Cloud AWS - Versus MySQL sur serveur dédié OVH
• Amélioration des schémas des bases de données, Accélération de la vitesse d'exécution des programmes et des procédures (70 min à moins de 5 Sec)
Organisme Public Gestionnaire d’une Métropole Urbaine
• Faible participation des citoyens dans les programmes de consultations
• Expérimentation d’un Plate-forme « Sentiment Analysis » pour un projet d’Amélioration du programme « Participation Citoyenne ».
• Collecter, analyser et visualiser les usages et données de Twitter, Facebook et de sites de presse en ligne (SudOuest.fr, Aqui.fr)
• Choix technique: Hadoop (CDH), ElasticSearch sur Cloud AWS
• Tableau de Bord synthétique de Scoring des thématiques populaires, et Analyses des Sentiments dégagés (positif, négatif ou neutre)
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
Importance de la DataVizualisation
Source de la
thématique
Analyse de la thématique
- Nombre de parutions
- Intérêt (lecture/consultation)
- Sentiments (Positif/neutre/négatif)
Importance de la DataVizualisation
37
# Validation de
l’Environnement Opérationnel
Les Changements dans le Système d’Information des
Entreprises
Logs Files Web Data
Relational
Databases
IDEs
BI /
Analytics
Enterprise
Reporting
Enterprise Data
Warehouse
Online Serving
Systems
Manager
SYSTEM
OPERATORS
ENGINEERS ANALYSTS BUSINESS USERS
Web/Mobile
Applications
CUSTOMERS
Sqoop
Sqoop
Sqoop
FlumeFlumeFlume
Modeling
Tools
DATA SCIENTISTS
DATA
ARCHITECTS
Meta Data/
ETL Tools
ODBC, JDBC,
NFS, HTTP
Choix de la
Distribution
BigData
Une puissante plate-forme BigData basée sur
Apache
• Cloudera est le plus grand contributeur au projet
Hadoop
• CDH est la 1ère distribution Hadoop 100% Open Source
prête à l’emploi pour les entreprises et la plus utilisée
• Intègre les projets les plus populaires liées à Hadoop
dans un package unique, testé rigoureusement et qui
garantit une fiabilité maximale lors de la mise en
production.
La liste des distributions Hadoop :
http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support
Une Plate-
forme pour
Stocker
toutes les
données
• Stockage et Traitement par Lots
• HDFS + NoSQL
• Gestionnaire de processus batch
BATCH
PROCESSING
WORKLOAD MANAGEMENT
STORAGE FOR ANY TYPE OF DATA
UNIFIED, ELASTIC, RESILIENT, SECURE
Filesystem Online NoSQL
Ouverte
avec des
méthodes
d‘Accès à
toutes les
données
• Fournir de multiples options pour intégrer les données
• S'appuyant sur les niveaux de compétences et les
investissements existants
BATCH
PROCESSING
ANALYTIC
SQL
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
WORKLOAD MANAGEMENT
STORAGE FOR ANY TYPE OF DATA
UNIFIED, ELASTIC, RESILIENT, SECURE
Filesystem Online NoSQL
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
Prêt pour
l'entreprise
avec une
Sécurité
Garantie
et la
Supervision
Globale
• Sécurité et Protection des données et outils pour les Audits
• Haute disponibilité avec sauvegarde automatique et reprise
après sinistre
• Système de Gestion Globale
BATCH
PROCESSING
ANALYTIC
SQL
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
3RD PARTY
APPS
WORKLOAD MANAGEMENT
STORAGE FOR ANY TYPE OF DATA
UNIFIED, ELASTIC, RESILIENT, SECURE
DATA
MANAGEMENT
SYSTEM
MANAGEMENT
Filesystem Online NoSQL
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
Solution pour toutes les Entreprises
Nouvelles
Possibilités
grâce aux
technologies
du BigData
Moteurs de
Recommandations
Analyse de
Sentiments
Modélisation des
Risques
Détection de la
Fraude
Analyse de
Campagne
Marketing
Analyse du taux de
désabonnement
des clients
Analyse Social
Graph
Réseau de
surveillance
Data Analytics
Source: Cloudera “Ten Common Hadoopable Problems”
BigData
Cas d’Usages !
• Moteurs de Recommandations: les géants du Web et les sites de e-commerce qui utilisent Hadoop,
l’utilisent pour proposer à leurs clients des produits et services basés sur l'analyse du profil utilisateur et
les données comportementales. LinkedIn utilise cette approche pour alimenter son "personnes que
vous connaissez peut-être", tandis qu’Amazon l’utilise pour proposer des produits liés aux habitudes
d’achats pour les consommateurs en ligne.
• Analyse de Sentiments: Utilisé en conjonction avec Hadoop, et des outils avancés d'analyse de texte,
essentiellement non structuré des médias sociaux et des publications et blogs de réseautage social, y
compris les tweets et messages Facebook, afin de déterminer le sentiment des utilisateurs liés à des
entreprises particulières, des marques ou des produits. L'analyse peut se concentrer sur une analyse
macro-sentiment jusqu'au sentiment de chaque utilisateur.
• Modélisation des Risques: les entreprises financières, les banques et d'autres utilisent Hadoop et
Entrepôts de données nouvelle génération pour analyser de grands volumes de données
transactionnelles pour déterminer le risque et l'exposition des actifs financiers, afin de préparer des
scenarii potentiels "what-if" basés sur le comportement du marché simulé, et de marquer des clients
potentiels pour le risque.
• Détection de la Fraude: Utiliser les techniques du BigData pour combiner le comportement des clients,
historiques et données transactionnelles pour détecter les activités frauduleuses. Les sociétés de cartes
de crédit, par exemple, utiliser les technologies BigData pour identifier le comportement transactionnel
qui indique une forte probabilité d'une carte volée.
• Analyse campagne de marketing: Les départements de marketing dans les industries ont longtemps
utilisé la technologie pour surveiller et évaluer l'efficacité des campagnes de marketing. BigData permet
aux équipes de marketing d’intégrer l'augmentation des volumes de données de plus en plus
granulaires pour augmenter la précision de l'analyse.
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
BigData
Cas d’Usages !
(suite.)
• Analyse du taux de désabonnement des clients: Les entreprises utilisent Hadoop et les technologies
de BigData pour analyser les données du comportement des clients pour identifier les modèles qui
indiquent que les clients sont plus susceptibles de les quitter pour un service ou fournisseur
concurrent. Action peut alors être prise pour sauver et garder les plus rentables de ces clients.
• Analyse Social Graph: les données de prochaine génération et les données de réseaux sociaux sont
extraites pour déterminer quels clients ont le plus d'influence sur les autres à l'intérieur de réseaux
sociaux. Ceci aide les entreprises à déterminer quels sont leurs «plus importants», clients qui ne sont
pas toujours ceux qui achètent le plus de produits ou dépensent le plus, mais ceux qui ont tendance à
influer sur le comportement d'achat d’autres personnes.
• Data Analytics: utiliser Hadoop et les grandes technologies connexes pour intégrer des données
provenant de canaux d'interaction client cloisonnés tels que centres d'appels, chat en ligne, Twitter,
etc… pour avoir une vision complète de l'expérience client. Cela permet aux entreprises de
comprendre l'impact d'un canal d'interaction client dispose sur un autre afin d'optimiser l'expérience
client dans son ensemble du cycle de vie.
• Réseau de surveillance: Hadoop et d'autres technologies BigData sont utilisés pour ingérer, analyser et
afficher les données collectées à partir des serveurs, périphériques de stockage et autres matériels
informatique pour permettre aux administrateurs de surveiller l'activité du réseau et de diagnostiquer
les goulots d'étranglement et autres problèmes. Ce type d'analyse peut également être appliqué à
d'autres formes de réseaux, notamment des Réseaux de Transport afin d'améliorer l'efficacité
énergétique.
• Recherche et développement: les entreprises, comme les fabricants de produits pharmaceutiques,
utilisent Hadoop pour passer au peigne fin les volumes énormes de texte basé sur la recherche et
d'autres données historiques pour aider au développement de nouveaux produits.
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
#3 Identifier les Compétences
Comment ?
Le Principal obstacle à l'adoption du BigData
 C’est le manque de Ressources et de Compétences Qualifiées
Selon McKinsey, à horizon 2018;
les États-Unis devront faire face à une pénurie de :
• 140.000 à 190.000 personnes avec des compétences d'analyse de données
• 1,5 million d’analystes avec le savoir-faire minimum leur permettant utiliser l'analyse de données massives
pour prendre des décisions efficaces.
En France;
Vu le faible taux de pénétration de ces nouveaux modèles de BigData dans les
entreprises, la pénurie devrait être proportionnellement plus importante.
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
Les Nouveaux Métiers
Pour Réaliser des Projets en utilisant les technologies du BigData
Chief Data Officer (CDO) : la responsabilité du CDO concerne les données et leur état : Valeur, Qualité, Fiabilité
et doit en garantir la Cohérence et Gouvernance.
Les données peuvent être d’origine interne ou externe, privée ou publique
Data Scientist : est chargé de développer les outils adaptés au besoin pour Collecter, Analyser et faire parler les
données numériques et, de les présenter sous un format simple et compréhensible (DataVizualisation)
Data Analyst : va manipuler les données une fois que la base est opérationnelle, afin de faire remonter les
informations nécessaires pour les prises de décisions.
Et faire évolution les métiers de Programmeurs, d’Architectes, d’Administrateurs Réseaux, de DBA … avec des
formations adaptées.
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
Excelerate Systems +30 Experts Certifiés Cloudera
• Depuis 2011, nous avons
développé un réseau de
consultants hautement
qualifiés.
• Architectes,
• Administrateurs,
• Développeurs,
• Analystes,
Statisticiens
• Data Scientistes
• Nous avons réalisé plusieurs
projets dans divers secteurs
d’activités.
• e-Commerce
• Jeux
• e-Gouvernement
• Banque et Finance
• Grande Distribution
• Marketing
• Communication
• Sécurité et Protection
des Données
Des Experts accessibles mondialement
• France
• 2 Développeur Certifié Cloudera
• 1 Administrateur Certifié Cloudera
• 2 Data Scientiste & Analyste
Canada
1 Développeur Certifié Cloudera
États Unis
1 Développeur Certifié Cloudera,
1 Administrateur Certifié Cloudera
1 Data Scientiste
Mexique
1 Administrateur Certifié Cloudera
Brésil
2 Développeurs Hadoop (Sao Paulo, Belém,
1 Administrateur Certifié Hadoop (Belém)
1 Développeur HBase (Rio)
@ExcelSysFrance
ExcelerateSystemsFrance
Contact@ExcelerateSystems.net
Chine
1 Administrateur Certifié Cloudera,
1 Développeur Certifié Cloudera,
Inde 2 Administrateurs Certifiés Cloudera,
2 Développeurs Certifiés Cloudera,
Chili
1 Développeur Cert.
Excelerate Systems Offices
Espagne
1 Développeur Cert.
+100 Clients nous font confiance…
Qui sommes-nous ?
#Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
• Entreprise Privée, Fondée en 2007 à Seattle, Washington USA
• Des bureaux pour l’Europe à Bordeaux (France), pour l’Amérique Latine à Mexico
(Mexique), et présence dans +20 pays
• Offre Riche dans 4 catégories
1. BigData, Cloud et Virtualisation.
2. Sécurité et Protection des Données et Optimisation des S.I
3. Gestion et Sécurité du Mobile en Entreprise et le CRM-Mobile.
4. Connectivité au Systèmes Centraux et l’intégration des Mainframes
Nos Partenaire, Nos Solutions
Stand J-4
BigData Paris 2014
1er & 2 Avril – CNIT La Défense
Doug Cutting
Intervention
le 1er Avril à 12h
Prochain Rendez-vous
BigData | Cloud | Mobile
Keep Calm and Protect your Data
@ExcelSysFrance
ExcelerateSystemsFrance
Excelerate Systems - BigData, Cloud & Security Community

Contenu connexe

ODP
CMSday 2013 - OpenData, BigData
PPT
CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...
PPT
CMSday 2013 - Capter un public international
PPT
CMSday 2013 - Doper votre audience en optimisant votre référencement ?
PDF
Pourquoi intégrer Odoo, l'ERP de dernière génération full web, au sein de son...
PDF
Un business agile avec des systèmes agiles, comment s'appuyer sur un cloud hy...
PPTX
App mobile force de vente - ERP Compiere et Odoo
PPT
Introduction Au Plm
CMSday 2013 - OpenData, BigData
CMSday 2013 - Investir dans un CMS : Comment les entreprises capitalisent-ell...
CMSday 2013 - Capter un public international
CMSday 2013 - Doper votre audience en optimisant votre référencement ?
Pourquoi intégrer Odoo, l'ERP de dernière génération full web, au sein de son...
Un business agile avec des systèmes agiles, comment s'appuyer sur un cloud hy...
App mobile force de vente - ERP Compiere et Odoo
Introduction Au Plm

Tendances (12)

PPT
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
PDF
Cwin16 - lyon - bayer better-idea
PPTX
Openerp 8
PDF
PRESENTATION JEMS GROUP
PDF
Petit-Déjeuner : Charlie et la Digital Factory
PDF
ErwanGauthier-ResumeFR
PDF
OpenERP, l'ERP open source dernière génération
PDF
Fujitsu edi 50
PDF
Le business veut tout, tout de suite ? Etes-vous passé en mode IT as a Service ?
PDF
Openday 28 Janvier
PPTX
Digital Business: vers une nouvelle gouvernance des SI ?
PDF
Introduction du séminaire IoT EISTI du 14 avril 2016
Vitamin'C "Les outils de gestion sur le cloud" - 25/09/13
Cwin16 - lyon - bayer better-idea
Openerp 8
PRESENTATION JEMS GROUP
Petit-Déjeuner : Charlie et la Digital Factory
ErwanGauthier-ResumeFR
OpenERP, l'ERP open source dernière génération
Fujitsu edi 50
Le business veut tout, tout de suite ? Etes-vous passé en mode IT as a Service ?
Openday 28 Janvier
Digital Business: vers une nouvelle gouvernance des SI ?
Introduction du séminaire IoT EISTI du 14 avril 2016
Publicité

En vedette (19)

PPT
Russian Word Of The Day
DOC
Importé à partir de Google Bloc-notes – Mon premier bloc-notes
PDF
Besídka
PDF
Compte Nickel : Vendra-t-on de l'assurance en bureau de tabac?
DOC
Crucigrama
PPTX
Instituto universitario politécnico
PDF
Livre blanc I Le jeu promotionnel, levier de vos campagnes marketing et commu...
DOC
Comprobación financiera pdcm
PPT
Ciências e os mandalas sobre desmatamento
PDF
supervisor support
PDF
Couleur sdv-presentation-publique
PDF
PoissonPilote - INIZIÀ - Business Model Canvas mai 2016
PDF
Carte Proposition de Valeur vpd
PDF
Operational Excellence - ABE Model
PDF
Compte Rendu D Intervention
PPT
تکنولوژی در دیم زارها
PDF
6052227 T0420 Ind A Notice Démontage Remontage L E R O Y O T34
PDF
A C T I V I TÉ S P R A T I Q U E S Et B T
PDF
Proposition de valeur atelier
Russian Word Of The Day
Importé à partir de Google Bloc-notes – Mon premier bloc-notes
Besídka
Compte Nickel : Vendra-t-on de l'assurance en bureau de tabac?
Crucigrama
Instituto universitario politécnico
Livre blanc I Le jeu promotionnel, levier de vos campagnes marketing et commu...
Comprobación financiera pdcm
Ciências e os mandalas sobre desmatamento
supervisor support
Couleur sdv-presentation-publique
PoissonPilote - INIZIÀ - Business Model Canvas mai 2016
Carte Proposition de Valeur vpd
Operational Excellence - ABE Model
Compte Rendu D Intervention
تکنولوژی در دیم زارها
6052227 T0420 Ind A Notice Démontage Remontage L E R O Y O T34
A C T I V I TÉ S P R A T I Q U E S Et B T
Proposition de valeur atelier
Publicité

Similaire à BigData on change d'ère ! (20)

PDF
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
PDF
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
PPSX
BigData BigBuzz @ Le Node
PPSX
BigData & Cloud @ Excelerate Systems France
PPTX
Big Data Des méandres des outils au potentiel business
PPTX
Introduction à la big data v3
PDF
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
PDF
Bigdata opensource
PPTX
Big data
PDF
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
PDF
BigData en France par Excelerate Systems
PDF
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
PPTX
Ecosystème Big Data
PPTX
Commencer avec Hadoop
PDF
Introduction au Big data
PPTX
Matinée 01 Big Data
PDF
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
PDF
Big Data, Charles Huot, Aproged,février 2013
PDF
Big Data ou comment retrouver une aiguille dans une botte de foin
PPSX
Plateforme DATA HUB / API
BigDataBx #1 - Journée BigData à la CCI de Bordeaux
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
BigData BigBuzz @ Le Node
BigData & Cloud @ Excelerate Systems France
Big Data Des méandres des outils au potentiel business
Introduction à la big data v3
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Bigdata opensource
Big data
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
BigData en France par Excelerate Systems
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
Ecosystème Big Data
Commencer avec Hadoop
Introduction au Big data
Matinée 01 Big Data
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data, Charles Huot, Aproged,février 2013
Big Data ou comment retrouver une aiguille dans une botte de foin
Plateforme DATA HUB / API

Plus de Excelerate Systems (13)

PPTX
Sécurité Zéro Confiance
PDF
Sécurité Zéro Confiance - La Fin du Périmètre de Sécurité
PPTX
Zero Trust Security / Sécurité Zéro Confiance
PPTX
Vision-AI | the Next AI | the Next Disruption in Data Accuracy
PDF
PECTORIS -|- LA CLINIQUE VIRTUELLE
PPTX
Le Net pour Tou(te)s
PPSX
E santé - Entrez dans l'ère du BigData
PDF
OpenData - BigData - OpenSource : l'inévitable convergence
PDF
BigDataBx #1 - Data Marketing, l'ère de l'intelligence numérique
PDF
BigDataBx #1 - BigData et Protection de Données Privées
PDF
BigDataBx #1 - Atelier 1 Cloudera Datawarehouse Optimisation
PDF
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
PPSX
La plateforme OpenData 3.0 pour libérer et valoriser les données
Sécurité Zéro Confiance
Sécurité Zéro Confiance - La Fin du Périmètre de Sécurité
Zero Trust Security / Sécurité Zéro Confiance
Vision-AI | the Next AI | the Next Disruption in Data Accuracy
PECTORIS -|- LA CLINIQUE VIRTUELLE
Le Net pour Tou(te)s
E santé - Entrez dans l'ère du BigData
OpenData - BigData - OpenSource : l'inévitable convergence
BigDataBx #1 - Data Marketing, l'ère de l'intelligence numérique
BigDataBx #1 - BigData et Protection de Données Privées
BigDataBx #1 - Atelier 1 Cloudera Datawarehouse Optimisation
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
La plateforme OpenData 3.0 pour libérer et valoriser les données

BigData on change d'ère !

  • 1. BigData | Cloud | Mobile | Security
  • 2. #BigData… on change d’ère ! Aadel Benyoussef Excelerate Systems France Aadel.Benyoussef@ExcelerateSystems.net +33 (0)5 24 61 56 81
  • 3. #Innovation  De Nouvelles Solutions pour de Vieux Problèmes  De Nouvelles Solutions pour de Nouveaux Problèmes
  • 5. #Innovation  De Nouvelles Solutions pour de Vieux Problèmes ?  De Nouvelles Solutions pour de Nouveaux Problèmes ? Alors, innovons !
  • 6. Au début de notre ère numérique… Informatique d’Entreprise • Affaire de Spécialistes • Centralisée • Inaccessible hors de l’entreprise
  • 7. Au début de notre ère numérique… Informatique d’Entreprise • Affaire de Spécialistes • Centralisée • Inaccessible hors de l’entreprise Informatique Personnelle • Mac .vs. PC • Individuelle • Isolée
  • 8. Notre environnement Numérique… aujourd’hui ! PC / Mac
  • 9. Notre environnement Numérique… aujourd’hui ! › Application d’Entreprise › Bureautique › Internet › Email › Réseaux Sociaux › Objets connectés › e-commerce › Banque en ligne › Jeux en réseau › Apps Mobiles › Sauvegarde et Transport de données › Échange / Partage › … etc. Cloud Objets Connectés Smartphones Tablettes Laptop Hybrydes PC / Mac Disques USB
  • 10. Ajourd’hui, les Entreprises s’intéressent à … Toutes les données Produites en Interne et en Externe … Mais aussi à toutes les données qui la Concernent ! Source : IBM
  • 13. Les 3V qui imposent le changement - Volume - Variété - Vitesse
  • 14. ÉvolutiondelaDonnées 10% - Données Structurées 1980 2014 90 % - Données Non-Structurées +3 trillion Go de données créées en 2013…  Plus de 90% sont des données non structurées  500 quadrillion de fichiers 1 Trillion = 1018, soit un milliard de milliards. 1 Quadrillion = 1024 Des changements considérables lors des 30 dernières années Applications Internet Smartphones & Tablettes Machines intelligentes Capteurs Quantités doublent tous les 2 Ans
  • 15. En route vers Le Changement Déterminer l’environnement opérationnel 1
  • 16. En route vers Le Changement Déterminer l’environnement opérationnel Analyser des cas d’usages 1 2
  • 17. En route vers Le Changement Déterminer l’environnement opérationnel Analyser des cas d’usages Identifier les Compétences 1 2 3
  • 20. Pourquoi utiliser Hadoop ? • Le moins Couteux (100% OpenSource) • Pour traiter des Peta-Octets de données • Le plus Rapide actuellement • Pour les Traitements Parallèles • Le Meilleur à ce jour • Pour apporter des Solutions à tous les problèmes de traitement de Données Massives
  • 21. Ecosystèmes Hadoop Source : Datameer +400 Partenaires Technologies et Services
  • 22. Les avantages de l'Open Source au-delà de l’éthique, il est question de : Facilité d’Adoption Acquisition et démonstration de la Valeur avec des investissements mesurées1
  • 23. Les avantages de l'Open Source au-delà de l’éthique, il est question de : Facilité d’Adoption Acquisition et démonstration de la Valeur avec des investissements mesurées1 Innovation et Développement Rapide Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les problèmes et Imaginer de nouveaux concepts 2
  • 24. Les avantages de l'Open Source au-delà de l’éthique, il est question de : Facilité d’Adoption Acquisition et démonstration de la Valeur avec des investissements mesurées1 Innovation et Développement Rapide Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les problèmes et Imaginer de nouveaux concepts 2 Extensibilité Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie3
  • 25. Les avantages de l'Open Source au-delà de l’éthique, il est question de : Facilité d’Adoption Acquisition et démonstration de la Valeur avec des investissements mesurées1 Innovation et Développement Rapide Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les problèmes et Imaginer de nouveaux concepts 2 Extensibilité Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie3 Pas de dépendance « Editeur » Pas de données ou processus « propriétaires" – la sélection des fournisseurs uniquement sur la Qualité des Services4
  • 26. Quelle importance accordez vous, dans la sélection d’un vendeur de BigData aux critères suivants: 7 8 9 Source: King Research, 3922 Respondents Evolutivité Performance Flexibilité Fiabilité du vendeur Technologie Sécurisée Intégration avec d'autres systèmes Coût Techniquement Supérieur aux autres Logiciel Open Source
  • 29. Quels sont les éléments qui déterminent votre choix de fournisseur de solution BigData? Source: King Research, 3922 Respondents 6 6,5 7 7,5 8 8,5 9 Formations Services de Consulting Recommandations Support Technique Richesse des Fonctionnalités
  • 30. 0% 20% 40% 60% Quelles infrastructures pensez-vous améliorer avec des solutions BigData ? Source: King Research, 3922 Respondents Traitements ETL Bases de Données Analytiques Stockage Enterprise Data Warehouse Système Central (Mainframe)
  • 31. 31 Quels sont les principaux avantages recherchés dans une solutions BigData d’entreprise Source: King Research, 3922 Respondents 10% 30% 50% 70% Amélioration des Analyses de Données Amélioration du Traitement de Données Prendre de Meilleures Décisions, Plus Rapidement Augmenter la Valeur marchande des Données Améliorer l‘Efficacité Opérationnelle Acquérir un Avantage Concurrentiel
  • 32. 15% 25% 35% 45% Quelles sont vos principaux développements d’applications BigData? Source: King Research, 3922 Respondents Recherche / Innovation Analyse Comportementale Connaissance des Clients Ciblage de Marché Analyse de l‘Expérience Client Amélioration Opérationnelle
  • 33. 33 #2 Analyser des Cas d’Usages
  • 34. #BigData en Pratique Société de Jeux Video • Succès d’un jeux sur Mobile  Augmentation exponentielle du nombre de joueurs  Lenteurs d’exécution des programmes d’Analyse comportementales • la transformation de l'architecture MySQL à vers NoSQL Choix technique: Hadoop (CDH) sur Cloud AWS - Versus MySQL sur serveur dédié OVH • Amélioration des schémas des bases de données, Accélération de la vitesse d'exécution des programmes et des procédures (70 min à moins de 5 Sec) Organisme Public Gestionnaire d’une Métropole Urbaine • Faible participation des citoyens dans les programmes de consultations • Expérimentation d’un Plate-forme « Sentiment Analysis » pour un projet d’Amélioration du programme « Participation Citoyenne ». • Collecter, analyser et visualiser les usages et données de Twitter, Facebook et de sites de presse en ligne (SudOuest.fr, Aqui.fr) • Choix technique: Hadoop (CDH), ElasticSearch sur Cloud AWS • Tableau de Bord synthétique de Scoring des thématiques populaires, et Analyses des Sentiments dégagés (positif, négatif ou neutre) #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 35. Importance de la DataVizualisation Source de la thématique Analyse de la thématique - Nombre de parutions - Intérêt (lecture/consultation) - Sentiments (Positif/neutre/négatif)
  • 36. Importance de la DataVizualisation
  • 38. Les Changements dans le Système d’Information des Entreprises Logs Files Web Data Relational Databases IDEs BI / Analytics Enterprise Reporting Enterprise Data Warehouse Online Serving Systems Manager SYSTEM OPERATORS ENGINEERS ANALYSTS BUSINESS USERS Web/Mobile Applications CUSTOMERS Sqoop Sqoop Sqoop FlumeFlumeFlume Modeling Tools DATA SCIENTISTS DATA ARCHITECTS Meta Data/ ETL Tools ODBC, JDBC, NFS, HTTP
  • 39. Choix de la Distribution BigData Une puissante plate-forme BigData basée sur Apache • Cloudera est le plus grand contributeur au projet Hadoop • CDH est la 1ère distribution Hadoop 100% Open Source prête à l’emploi pour les entreprises et la plus utilisée • Intègre les projets les plus populaires liées à Hadoop dans un package unique, testé rigoureusement et qui garantit une fiabilité maximale lors de la mise en production. La liste des distributions Hadoop : http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support
  • 40. Une Plate- forme pour Stocker toutes les données • Stockage et Traitement par Lots • HDFS + NoSQL • Gestionnaire de processus batch BATCH PROCESSING WORKLOAD MANAGEMENT STORAGE FOR ANY TYPE OF DATA UNIFIED, ELASTIC, RESILIENT, SECURE Filesystem Online NoSQL
  • 41. Ouverte avec des méthodes d‘Accès à toutes les données • Fournir de multiples options pour intégrer les données • S'appuyant sur les niveaux de compétences et les investissements existants BATCH PROCESSING ANALYTIC SQL SEARCH ENGINE MACHINE LEARNING STREAM PROCESSING WORKLOAD MANAGEMENT STORAGE FOR ANY TYPE OF DATA UNIFIED, ELASTIC, RESILIENT, SECURE Filesystem Online NoSQL #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 42. Prêt pour l'entreprise avec une Sécurité Garantie et la Supervision Globale • Sécurité et Protection des données et outils pour les Audits • Haute disponibilité avec sauvegarde automatique et reprise après sinistre • Système de Gestion Globale BATCH PROCESSING ANALYTIC SQL SEARCH ENGINE MACHINE LEARNING STREAM PROCESSING 3RD PARTY APPS WORKLOAD MANAGEMENT STORAGE FOR ANY TYPE OF DATA UNIFIED, ELASTIC, RESILIENT, SECURE DATA MANAGEMENT SYSTEM MANAGEMENT Filesystem Online NoSQL #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 43. Solution pour toutes les Entreprises
  • 44. Nouvelles Possibilités grâce aux technologies du BigData Moteurs de Recommandations Analyse de Sentiments Modélisation des Risques Détection de la Fraude Analyse de Campagne Marketing Analyse du taux de désabonnement des clients Analyse Social Graph Réseau de surveillance Data Analytics Source: Cloudera “Ten Common Hadoopable Problems”
  • 45. BigData Cas d’Usages ! • Moteurs de Recommandations: les géants du Web et les sites de e-commerce qui utilisent Hadoop, l’utilisent pour proposer à leurs clients des produits et services basés sur l'analyse du profil utilisateur et les données comportementales. LinkedIn utilise cette approche pour alimenter son "personnes que vous connaissez peut-être", tandis qu’Amazon l’utilise pour proposer des produits liés aux habitudes d’achats pour les consommateurs en ligne. • Analyse de Sentiments: Utilisé en conjonction avec Hadoop, et des outils avancés d'analyse de texte, essentiellement non structuré des médias sociaux et des publications et blogs de réseautage social, y compris les tweets et messages Facebook, afin de déterminer le sentiment des utilisateurs liés à des entreprises particulières, des marques ou des produits. L'analyse peut se concentrer sur une analyse macro-sentiment jusqu'au sentiment de chaque utilisateur. • Modélisation des Risques: les entreprises financières, les banques et d'autres utilisent Hadoop et Entrepôts de données nouvelle génération pour analyser de grands volumes de données transactionnelles pour déterminer le risque et l'exposition des actifs financiers, afin de préparer des scenarii potentiels "what-if" basés sur le comportement du marché simulé, et de marquer des clients potentiels pour le risque. • Détection de la Fraude: Utiliser les techniques du BigData pour combiner le comportement des clients, historiques et données transactionnelles pour détecter les activités frauduleuses. Les sociétés de cartes de crédit, par exemple, utiliser les technologies BigData pour identifier le comportement transactionnel qui indique une forte probabilité d'une carte volée. • Analyse campagne de marketing: Les départements de marketing dans les industries ont longtemps utilisé la technologie pour surveiller et évaluer l'efficacité des campagnes de marketing. BigData permet aux équipes de marketing d’intégrer l'augmentation des volumes de données de plus en plus granulaires pour augmenter la précision de l'analyse. #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 46. BigData Cas d’Usages ! (suite.) • Analyse du taux de désabonnement des clients: Les entreprises utilisent Hadoop et les technologies de BigData pour analyser les données du comportement des clients pour identifier les modèles qui indiquent que les clients sont plus susceptibles de les quitter pour un service ou fournisseur concurrent. Action peut alors être prise pour sauver et garder les plus rentables de ces clients. • Analyse Social Graph: les données de prochaine génération et les données de réseaux sociaux sont extraites pour déterminer quels clients ont le plus d'influence sur les autres à l'intérieur de réseaux sociaux. Ceci aide les entreprises à déterminer quels sont leurs «plus importants», clients qui ne sont pas toujours ceux qui achètent le plus de produits ou dépensent le plus, mais ceux qui ont tendance à influer sur le comportement d'achat d’autres personnes. • Data Analytics: utiliser Hadoop et les grandes technologies connexes pour intégrer des données provenant de canaux d'interaction client cloisonnés tels que centres d'appels, chat en ligne, Twitter, etc… pour avoir une vision complète de l'expérience client. Cela permet aux entreprises de comprendre l'impact d'un canal d'interaction client dispose sur un autre afin d'optimiser l'expérience client dans son ensemble du cycle de vie. • Réseau de surveillance: Hadoop et d'autres technologies BigData sont utilisés pour ingérer, analyser et afficher les données collectées à partir des serveurs, périphériques de stockage et autres matériels informatique pour permettre aux administrateurs de surveiller l'activité du réseau et de diagnostiquer les goulots d'étranglement et autres problèmes. Ce type d'analyse peut également être appliqué à d'autres formes de réseaux, notamment des Réseaux de Transport afin d'améliorer l'efficacité énergétique. • Recherche et développement: les entreprises, comme les fabricants de produits pharmaceutiques, utilisent Hadoop pour passer au peigne fin les volumes énormes de texte basé sur la recherche et d'autres données historiques pour aider au développement de nouveaux produits. #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 47. #3 Identifier les Compétences
  • 48. Comment ? Le Principal obstacle à l'adoption du BigData  C’est le manque de Ressources et de Compétences Qualifiées Selon McKinsey, à horizon 2018; les États-Unis devront faire face à une pénurie de : • 140.000 à 190.000 personnes avec des compétences d'analyse de données • 1,5 million d’analystes avec le savoir-faire minimum leur permettant utiliser l'analyse de données massives pour prendre des décisions efficaces. En France; Vu le faible taux de pénétration de ces nouveaux modèles de BigData dans les entreprises, la pénurie devrait être proportionnellement plus importante. #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 49. Les Nouveaux Métiers Pour Réaliser des Projets en utilisant les technologies du BigData Chief Data Officer (CDO) : la responsabilité du CDO concerne les données et leur état : Valeur, Qualité, Fiabilité et doit en garantir la Cohérence et Gouvernance. Les données peuvent être d’origine interne ou externe, privée ou publique Data Scientist : est chargé de développer les outils adaptés au besoin pour Collecter, Analyser et faire parler les données numériques et, de les présenter sous un format simple et compréhensible (DataVizualisation) Data Analyst : va manipuler les données une fois que la base est opérationnelle, afin de faire remonter les informations nécessaires pour les prises de décisions. Et faire évolution les métiers de Programmeurs, d’Architectes, d’Administrateurs Réseaux, de DBA … avec des formations adaptées. #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance
  • 50. Excelerate Systems +30 Experts Certifiés Cloudera • Depuis 2011, nous avons développé un réseau de consultants hautement qualifiés. • Architectes, • Administrateurs, • Développeurs, • Analystes, Statisticiens • Data Scientistes • Nous avons réalisé plusieurs projets dans divers secteurs d’activités. • e-Commerce • Jeux • e-Gouvernement • Banque et Finance • Grande Distribution • Marketing • Communication • Sécurité et Protection des Données
  • 51. Des Experts accessibles mondialement • France • 2 Développeur Certifié Cloudera • 1 Administrateur Certifié Cloudera • 2 Data Scientiste & Analyste Canada 1 Développeur Certifié Cloudera États Unis 1 Développeur Certifié Cloudera, 1 Administrateur Certifié Cloudera 1 Data Scientiste Mexique 1 Administrateur Certifié Cloudera Brésil 2 Développeurs Hadoop (Sao Paulo, Belém, 1 Administrateur Certifié Hadoop (Belém) 1 Développeur HBase (Rio) @ExcelSysFrance ExcelerateSystemsFrance Contact@ExcelerateSystems.net Chine 1 Administrateur Certifié Cloudera, 1 Développeur Certifié Cloudera, Inde 2 Administrateurs Certifiés Cloudera, 2 Développeurs Certifiés Cloudera, Chili 1 Développeur Cert. Excelerate Systems Offices Espagne 1 Développeur Cert.
  • 52. +100 Clients nous font confiance…
  • 53. Qui sommes-nous ? #Cloud #BigData #Security #Mobile @ExcelSysFrance ExcelerateSystemsFrance • Entreprise Privée, Fondée en 2007 à Seattle, Washington USA • Des bureaux pour l’Europe à Bordeaux (France), pour l’Amérique Latine à Mexico (Mexique), et présence dans +20 pays • Offre Riche dans 4 catégories 1. BigData, Cloud et Virtualisation. 2. Sécurité et Protection des Données et Optimisation des S.I 3. Gestion et Sécurité du Mobile en Entreprise et le CRM-Mobile. 4. Connectivité au Systèmes Centraux et l’intégration des Mainframes
  • 54. Nos Partenaire, Nos Solutions
  • 55. Stand J-4 BigData Paris 2014 1er & 2 Avril – CNIT La Défense Doug Cutting Intervention le 1er Avril à 12h Prochain Rendez-vous
  • 56. BigData | Cloud | Mobile Keep Calm and Protect your Data @ExcelSysFrance ExcelerateSystemsFrance Excelerate Systems - BigData, Cloud & Security Community