SlideShare a Scribd company logo
Marketing Intelligence
voor Managers –
Data Science Exploratory
Analysis
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 2
Deze blog is onderdeel van de themareeks ‘Management & BI’. De themareeks is bedoeld voor
managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in
begrijpelijke taal en zonder alle technische termen en hypes.
In vorige blogs heb ik nader toegelicht wat data science is en hoe het voor marketing waardevol
kan zijn. Ook heb ik de rol van de data scientist, het proces van data science en de databronnen
voor data science wat nader beschreven.
Interne en externe databronnen leveren data op. Data die de data scientist wellicht eerst eens wil
bekijken op eventueel verklarende verbanden. Daarom leek het me goed om deze keer eens te
kijken naar exploratieve data analyse. Anders gezegd: het analyseren van data om te onderzoeken
of daarin verbanden zijn te vinden.
Introductie
Exploratory Data Analysis (EDA) is een eerste stap in het bekijken van de geëxtraheerde en
schoongemaakte data. Meestal doe je dat door deze data visueel te maken in wat genoemd
worden: Exploratory Graphs.
Met exploratieve data analyse wil je een eerste indruk krijgen van de data door deze op
verschillende manieren aan elkaar te relateren. Het is mogelijk dat sommige ‘variabelen’ een
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 3
onderling verband laten zien en sommige juist niet. Met de gevonden verbanden tussen bepaalde
variabelen kun je dan proberen statistische modellen te vinden die het best aansluiten bij dat
mogelijke verband.
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 4
Principes van Exploratieve Data Analyse
In paar zaken zijn kenmerkend voor EDA:
• Vergelijkend onderzoek
Het vinden van bewijs voor een bepaalde hypothese is altijd relatief tegenover een alternatieve
hypothese. Je stelt je dus altijd de vraag: “maar vergeleken met wat dan?”. Binnen marketing
gebruik je daarvoor meestal een ‘control groep’. Bijvoorbeeld een groep prospects die niet wordt
blootgesteld aan bepaalde reclame-uitingen. Hiermee krijg je een soort ‘ceteris paribus’ (alle
andere omstandigheden gelijkblijvend). De control groep vertoont het ‘normale’ gedrag zonder de
invloed van prikkels. De target groep krijgt wel prikkels, waardoor je het resulterend gedrag
tussen target en control groep met elkaar kunt vergelijken.
• Causaliteit
Binnen EDA wordt altijd gezocht naar een mogelijke onderliggende verklaring van een
(ogenschijnlijk) verband. Je zoekt naar een oorzaak-gevolg relatie, naar een logisch verklarend
mechanisme of naar een systematische structuur. Veelal probeer je ‘tussenliggende’ variabelen te
vinden die hetzelfde verband laten zien en die bijdragen aan de logische verklaring van het
fenomeen.
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 5
• Multivariate data
De data scientist werkt meestal met meerdere variabelen tegelijkertijd, omdat er vaak meerdere
variabelen tegelijk van invloed kunnen zijn op het verband dat we proberen te vinden. Ook al
helpt de control/target-groep-constructie om één ‘onafhankelijke’ variabele beïnvloedend te laten
zijn, het is vrijwel onmogelijk om de werkelijke tegenwoordige wereld te temmen. Om ons heen
bestaan zoveel prikkels, dat het zeer onwaarschijnlijk is dat slechts één variabele zo netjes valt te
separeren. Daarom werkt de data scientist in veel gevallen met veel meer variabelen. Stel dat je
een jaar lang meet hoe een wekelijks geplaatste advertentie het aankoopgedrag van het
geadverteerde product beïnvloedt. Als je deze tegenover elkaar zet in een exploratieve grafiek
dan zou je een aflopend verband kunnen vinden en tot de conclusie kunnen komen dat die
advertentie geen positief effect heeft. Stel dat je diezelfde data eens in vier grafieken naast elkaar
zet voor elk van de vier seizoenen, dan kan het blijken dat alle seizoenen een stijgende verkoop
laten zien! Dus: houden, die advertentie. Je zal zeggen: “dat is onmogelijk”. Maar dat is niet zo!
Voor de liefhebbers: het is een voorbeeld van Simpson’s paradox (go check a funny youTube of
kijk even op Wikipedia). Feitelijk verstoort de variabele ‘seizoen’ (confounding variable) de relatie
tussen advertentie en koopgedrag. Daarom is het van belang om veel variabelen mee te nemen
als je verbanden probeert te ontdekken.
• Bewijsvoering
Bij EDA is het belangrijk om de bewijsvoering van je gevonden verbanden niet alleen als grafiek te
tonen met duidelijke labels, grootheden en gebruikte bronnen, maar om die te combineren met
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 6
beschrijvingen van de logica, in woorden, cijfers en plaatjes. Hierbij geldt: de analyse is zo sterk
als haar kwaliteit, relevantie en integriteit. Ook hier dus ‘content is king’.
Visualisatie van Exploratieve Data Analyse
Bij EDA wordt veel gebruik gemaakt van het visualiseren van data in zogenoemde ‘Exploratory
Graphs’. Dit zijn snel opgestelde ‘plots’ van tegenover elkaar gezette variabelen om patronen
inzichtelijk te maken. De toolbox van de data scientist kent daarvoor bijvoorbeeld in R, drie
algemeen gebruikte graphing-packages namelijk: base, lattice of ggplot2. Naast deze standaard
tools, kun je tegenwoordig echter ook gebruik maken van betaalde visualisatie-tools, zoals Tableau
of QlikSense.
Explorative graphing wordt niet gebruikt om resultaten te presenteren, maar om de eigenschappen
van je data te begrijpen, om patronen te vinden in de data, om suggesties te verkrijgen voor
manieren om de data te modelleren en om fouten uit je analyse te detecteren. Explorative graphs
worden dan ook quick & dirty gemaakt, als een soort try-out en je zal er tijdens de EDA-fase veel
van maken. Ze zijn bedoeld voor persoonlijk inzicht en ze worden niet fraai gemaakt voor
presentatie van de resultaten of voor communicatie.
Voor het weergeven van eendimensionale data worden meestal boxplots, histograms, density plots
of barplots gebruikt. Voor tweedimensionale data zijn dat meestal multiple 1D-plots of (smooth)
scatterplots. Meer dan twee dimensies doet de data scientist vaak in multiple 2D-plots, door het
Marketing Intelligence voor Managers – Data Science Exploratory Analysis
Pg, 7
variëren van grootte, kleur of vorm van de meetpunten of zelfs door spinning plots en echte 3D-
plots. Maar die laatste zijn in de praktijk minder bruikbaar.
Ben je nieuwsgierig naar de komende blogs over Marketing Intelligence? Abonneer je via
onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks
verschijnt, krijg je automatisch een seintje (per e-mail) met een link.
Laat hier een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt
aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen
de reeks wordt besproken.

More Related Content

PDF
Marketing intelligence voor managers – de marketing data scientist
PDF
SolvX whitepaper - voorspellende modellen
PDF
Marketing intelligence voor managers – data science proces
PDF
Sow brochure 2016-10-27
PDF
Marketing intelligence voor managers – data science - Intro
RTF
The Arab World
PDF
Schema
PPTX
][uyjh21
Marketing intelligence voor managers – de marketing data scientist
SolvX whitepaper - voorspellende modellen
Marketing intelligence voor managers – data science proces
Sow brochure 2016-10-27
Marketing intelligence voor managers – data science - Intro
The Arab World
Schema
][uyjh21

Viewers also liked (15)

PDF
Swiss-Belhotel Award Nominee Certificates
PDF
Ciaj journal(2011.8)
DOC
Toimintakertomus2011
DOC
Esic ap recruitment for 120 udc, mts exam 2012 coaching at cheap rate with fr...
PDF
Unitario riunione del 10 10-2012
PPT
Meeting Marketplace Virtual Tour
PPT
Modaliteiten
PDF
Grupo 3 secretarios ideas más importantes
PPTX
Angele nieuwjaarsgroet voor 2012
DOC
December54b16
PDF
KTG_PM_CMT 13 FoD_DE.pdf
PDF
Afstudeerverslag Meten iBewustzijn
DOC
S P I R I T U A L I S M M A T E R I A L I S M A N D N A M A S M A R A N D R
PDF
Apresentacao Lunarys Cosmeticos | Plano de Negócio Lunarys Multinivel
PPTX
Personalbindung 20160510 ak personalentwicklung si sax
Swiss-Belhotel Award Nominee Certificates
Ciaj journal(2011.8)
Toimintakertomus2011
Esic ap recruitment for 120 udc, mts exam 2012 coaching at cheap rate with fr...
Unitario riunione del 10 10-2012
Meeting Marketplace Virtual Tour
Modaliteiten
Grupo 3 secretarios ideas más importantes
Angele nieuwjaarsgroet voor 2012
December54b16
KTG_PM_CMT 13 FoD_DE.pdf
Afstudeerverslag Meten iBewustzijn
S P I R I T U A L I S M M A T E R I A L I S M A N D N A M A S M A R A N D R
Apresentacao Lunarys Cosmeticos | Plano de Negócio Lunarys Multinivel
Personalbindung 20160510 ak personalentwicklung si sax
Ad

Similar to Marketing intelligence voor managers – data science exploratory analysis (20)

PDF
Presentatie Knowledge Graphs
PDF
Interview - Visma
PPTX
Social media & data analytics bij #SMC070
PDF
Kaartenset supplement Masterclass 2
PDF
De concurrentie in social media voorblijven
DOCX
Marketing Intelligence voor Managers – Big Data voor MKB (2)
PDF
Marketing Intelligence voor Managers - Zinvolle Big Data
PDF
Interview - Raet
PDF
Kaartenset supplement Masterclass 3
PDF
HR analytics & HR reporting = HR Intelligence, een introductie
PPTX
Hoe maak ik effectief gebruik van Data Analytics?
PPTX
Software for big data - setting the scene
PDF
Marketing intelligence voor managers – big data voor mkb
PDF
Marketing Intelligence voor Managers – Stappenplan voor toolkeuze
PDF
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
PPS
Ontwerpen van een onderzoek V1.2
PDF
Tutorial Data Science
PDF
Ngi data science
PDF
GraydonNL_Data-Driven-Marketing-Voor-B2B-Marketeers
Presentatie Knowledge Graphs
Interview - Visma
Social media & data analytics bij #SMC070
Kaartenset supplement Masterclass 2
De concurrentie in social media voorblijven
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers - Zinvolle Big Data
Interview - Raet
Kaartenset supplement Masterclass 3
HR analytics & HR reporting = HR Intelligence, een introductie
Hoe maak ik effectief gebruik van Data Analytics?
Software for big data - setting the scene
Marketing intelligence voor managers – big data voor mkb
Marketing Intelligence voor Managers – Stappenplan voor toolkeuze
marketing intelligence voor managers – wat is big data? en moeten we er inmid...
Ontwerpen van een onderzoek V1.2
Tutorial Data Science
Ngi data science
GraydonNL_Data-Driven-Marketing-Voor-B2B-Marketeers
Ad

More from FourPoints Business Intelligence (20)

PDF
De Definition of Done: essentieel voor verwachtingsmanagement
PDF
Business Intelligence voor Managers – Geef Big Data de ruimte
PDF
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
PDF
marketing intelligence voor managers - big data heeft data science nodig
PDF
BI architectuur - business versus enterprise
DOCX
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
DOCX
Marketing Intelligence voor Managers – Marketing Automation Tools
PDF
Marketing intelligence voor managers – de marketing cyclus
PDF
Marketing Intelligence voor Managers – Customer Data voor MKB
PDF
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
PDF
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
PDF
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
PDF
Marketing Intelligence voor Managers – Standaardmodel klantcontact
PDF
Marketing Intelligence voor Managers – 5 uitdagingen voor Marketing
PDF
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
PDF
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
PDF
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
PDF
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
PDF
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
PDF
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...
De Definition of Done: essentieel voor verwachtingsmanagement
Business Intelligence voor Managers – Geef Big Data de ruimte
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
marketing intelligence voor managers - big data heeft data science nodig
BI architectuur - business versus enterprise
Marketing Intelligence voor Managers – Het Marketing Data Lake (2)
Marketing Intelligence voor Managers – Marketing Automation Tools
Marketing intelligence voor managers – de marketing cyclus
Marketing Intelligence voor Managers – Customer Data voor MKB
Marketing Intelligence voor Managers – Inbound Marketing voor MKB
Marketing Intelligence voor Managers – Inbound, een organisatorisch debacle?
Marketing Intelligence voor Managers – Kanalen, Verkoop en Marketing
Marketing Intelligence voor Managers – Standaardmodel klantcontact
Marketing Intelligence voor Managers – 5 uitdagingen voor Marketing
De 8 BI-groeisignalen voor managers - Situatie 8: enterprise Dwh (EDW)
De 8 BI-groeisignalen voor managers - Situatie 7: het Centraal Dwh
De 8 BI-groeisignalen voor managers - Situatie 2: front-end BI-tools
De 8 BI-groeisignalen voor managers - Situatie 4: Het afdeling data warehouse
De 8 BI-groeisignalen voor managers - Situatie 3: Front-end BI-server
De 8 BI-groeisignalen voor managers - Situatie 5: Het geborgd afdeling data w...

Marketing intelligence voor managers – data science exploratory analysis

  • 1. Marketing Intelligence voor Managers – Data Science Exploratory Analysis
  • 2. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 2 Deze blog is onderdeel van de themareeks ‘Management & BI’. De themareeks is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in begrijpelijke taal en zonder alle technische termen en hypes. In vorige blogs heb ik nader toegelicht wat data science is en hoe het voor marketing waardevol kan zijn. Ook heb ik de rol van de data scientist, het proces van data science en de databronnen voor data science wat nader beschreven. Interne en externe databronnen leveren data op. Data die de data scientist wellicht eerst eens wil bekijken op eventueel verklarende verbanden. Daarom leek het me goed om deze keer eens te kijken naar exploratieve data analyse. Anders gezegd: het analyseren van data om te onderzoeken of daarin verbanden zijn te vinden. Introductie Exploratory Data Analysis (EDA) is een eerste stap in het bekijken van de geëxtraheerde en schoongemaakte data. Meestal doe je dat door deze data visueel te maken in wat genoemd worden: Exploratory Graphs. Met exploratieve data analyse wil je een eerste indruk krijgen van de data door deze op verschillende manieren aan elkaar te relateren. Het is mogelijk dat sommige ‘variabelen’ een
  • 3. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 3 onderling verband laten zien en sommige juist niet. Met de gevonden verbanden tussen bepaalde variabelen kun je dan proberen statistische modellen te vinden die het best aansluiten bij dat mogelijke verband.
  • 4. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 4 Principes van Exploratieve Data Analyse In paar zaken zijn kenmerkend voor EDA: • Vergelijkend onderzoek Het vinden van bewijs voor een bepaalde hypothese is altijd relatief tegenover een alternatieve hypothese. Je stelt je dus altijd de vraag: “maar vergeleken met wat dan?”. Binnen marketing gebruik je daarvoor meestal een ‘control groep’. Bijvoorbeeld een groep prospects die niet wordt blootgesteld aan bepaalde reclame-uitingen. Hiermee krijg je een soort ‘ceteris paribus’ (alle andere omstandigheden gelijkblijvend). De control groep vertoont het ‘normale’ gedrag zonder de invloed van prikkels. De target groep krijgt wel prikkels, waardoor je het resulterend gedrag tussen target en control groep met elkaar kunt vergelijken. • Causaliteit Binnen EDA wordt altijd gezocht naar een mogelijke onderliggende verklaring van een (ogenschijnlijk) verband. Je zoekt naar een oorzaak-gevolg relatie, naar een logisch verklarend mechanisme of naar een systematische structuur. Veelal probeer je ‘tussenliggende’ variabelen te vinden die hetzelfde verband laten zien en die bijdragen aan de logische verklaring van het fenomeen.
  • 5. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 5 • Multivariate data De data scientist werkt meestal met meerdere variabelen tegelijkertijd, omdat er vaak meerdere variabelen tegelijk van invloed kunnen zijn op het verband dat we proberen te vinden. Ook al helpt de control/target-groep-constructie om één ‘onafhankelijke’ variabele beïnvloedend te laten zijn, het is vrijwel onmogelijk om de werkelijke tegenwoordige wereld te temmen. Om ons heen bestaan zoveel prikkels, dat het zeer onwaarschijnlijk is dat slechts één variabele zo netjes valt te separeren. Daarom werkt de data scientist in veel gevallen met veel meer variabelen. Stel dat je een jaar lang meet hoe een wekelijks geplaatste advertentie het aankoopgedrag van het geadverteerde product beïnvloedt. Als je deze tegenover elkaar zet in een exploratieve grafiek dan zou je een aflopend verband kunnen vinden en tot de conclusie kunnen komen dat die advertentie geen positief effect heeft. Stel dat je diezelfde data eens in vier grafieken naast elkaar zet voor elk van de vier seizoenen, dan kan het blijken dat alle seizoenen een stijgende verkoop laten zien! Dus: houden, die advertentie. Je zal zeggen: “dat is onmogelijk”. Maar dat is niet zo! Voor de liefhebbers: het is een voorbeeld van Simpson’s paradox (go check a funny youTube of kijk even op Wikipedia). Feitelijk verstoort de variabele ‘seizoen’ (confounding variable) de relatie tussen advertentie en koopgedrag. Daarom is het van belang om veel variabelen mee te nemen als je verbanden probeert te ontdekken. • Bewijsvoering Bij EDA is het belangrijk om de bewijsvoering van je gevonden verbanden niet alleen als grafiek te tonen met duidelijke labels, grootheden en gebruikte bronnen, maar om die te combineren met
  • 6. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 6 beschrijvingen van de logica, in woorden, cijfers en plaatjes. Hierbij geldt: de analyse is zo sterk als haar kwaliteit, relevantie en integriteit. Ook hier dus ‘content is king’. Visualisatie van Exploratieve Data Analyse Bij EDA wordt veel gebruik gemaakt van het visualiseren van data in zogenoemde ‘Exploratory Graphs’. Dit zijn snel opgestelde ‘plots’ van tegenover elkaar gezette variabelen om patronen inzichtelijk te maken. De toolbox van de data scientist kent daarvoor bijvoorbeeld in R, drie algemeen gebruikte graphing-packages namelijk: base, lattice of ggplot2. Naast deze standaard tools, kun je tegenwoordig echter ook gebruik maken van betaalde visualisatie-tools, zoals Tableau of QlikSense. Explorative graphing wordt niet gebruikt om resultaten te presenteren, maar om de eigenschappen van je data te begrijpen, om patronen te vinden in de data, om suggesties te verkrijgen voor manieren om de data te modelleren en om fouten uit je analyse te detecteren. Explorative graphs worden dan ook quick & dirty gemaakt, als een soort try-out en je zal er tijdens de EDA-fase veel van maken. Ze zijn bedoeld voor persoonlijk inzicht en ze worden niet fraai gemaakt voor presentatie van de resultaten of voor communicatie. Voor het weergeven van eendimensionale data worden meestal boxplots, histograms, density plots of barplots gebruikt. Voor tweedimensionale data zijn dat meestal multiple 1D-plots of (smooth) scatterplots. Meer dan twee dimensies doet de data scientist vaak in multiple 2D-plots, door het
  • 7. Marketing Intelligence voor Managers – Data Science Exploratory Analysis Pg, 7 variëren van grootte, kleur of vorm van de meetpunten of zelfs door spinning plots en echte 3D- plots. Maar die laatste zijn in de praktijk minder bruikbaar. Ben je nieuwsgierig naar de komende blogs over Marketing Intelligence? Abonneer je via onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks verschijnt, krijg je automatisch een seintje (per e-mail) met een link. Laat hier een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen de reeks wordt besproken.