SlideShare una empresa de Scribd logo
DATA SCIENCE
Analítica Predictiva y Evolución de BI
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
PATRICIO DEL BOCA
PI Co-founder
@pdelboca
pdelboca@piconsulting.com.ar
RODRIGO BOBADILLA
Data Scientist en PI
@rodrib_08
rbobadilla@piconsulting.com.ar
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes.
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
OBJETIVO
Dar una introducción a Data Science para conocer los conceptos y características
fundamentales de esta disciplina.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Data Science?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
2015
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Bajos costos de procesamiento,
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
algoritmos,
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
y muchos datos.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Nuevo rol, Data Scientist.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
We define Data Science as managing the process
that can transform hypothesis and data into
actionable predictions.
- Practical Data Science with R -
”
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
EVOLUCION DE BI
¿Cuál es el perfil de los clientes que
han dejado de usar mi servicio?
¿Qué clientes van a abandonar
el uso de mi servicio?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Detección de Fraude
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Detección de Patrones y
Segmentación de Clientes
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Sistemas de Recomendación
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Predicción de Abandono de Marca
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Predicción de Demanda
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Scoring y Riesgo Crediticio
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
Mantenimiento Predictivo
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
ALGORITMOS
SUPERVISADOS
Clasificación
Regresión
Motores de Recomendación
Detección de Anomalías
ALGORITMOS
NO SUPERVISADOS
Clustering
Clustering Jerárquico
Mapas auto organizados
Descubrimiento de Patrones
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
CICLO DE VIDA
- CRISP-DM, el “SCRUM” de Data Science.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
1. COMPRENSIÓN DEL NEGOCIO
- ¿Cuál es el valor que aporta al negocio este proyecto?
- ¿Cómo puede saber que sus resultados son precisos o efectivos?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
2. COMPRENSIÓN DE LOS DATOS
- Análisis de completitud de los datos
- Búsqueda de errores
- Análisis de valores extremos
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
3. PREPARACIÓN DE LOS DATOS
- Limpieza de datos
- Feature engineering
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
4. MODELADO
- Generalización que busca explicar y predecir el comportamiento de los datos
- “Essentially all models are wrong, but some are useful.” George E. P. Box
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
5. EVALUACIÓN
- ¿Resuelve el modelo el objetivo que planteamos?
- Análisis de los errores y planificación de próximos pasos
- Si es demasiado bueno para ser verdad, probablemente lo sea! (Overfitting)
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
6. IMPLEMENTACIÓN
- Presentación de los resultados a todos los stakeholders
- Implementación del modelos en producción
- Tiempo Real vs Procesamiento en Lote
- Cloud vs On-Premise
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
At the end of the day, it is usually how we frame
the problem, not the tools and techniques that
we use to answer it, that determines how
valuable our work is.
- Thinking with Data, Max Shron -
”
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
AGENDA
Objetivo
Introducción
¿Qué es Data Science?
Soluciones y usos más frecuentes
Ciclo de Vida de un Proyecto
Demo
Thumb Rules
Big Data
Conclusiones
Preguntas
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
THUMB-RULES
- ¿Hay datos disponibles? ¿Etiquetados? ¿Cuántos?
- ¿Qué tipo de datos?
- Garbage In, Garbage Out.
- Iniciar siempre con una prueba de concepto.
- ¿Está el negocio comprometido con un trabajo de calidad?
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
BIG DATA
“Big Data es cuando el tamaño comienza a ser un problema y los datos ya no
pueden ser procesados en una sola terminal de cómputo.” - Consenso Popular -
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
CONCLUSIONES
- Data Science es un proceso Iterativo que requiere de muchas idas y vueltas
entre cada etapa
- Lo más importante en un Proyecto es la pregunta que se hace para abordar una
problemática concreta, más aún que las herramientas que se usen.
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
PREGUNTAS?
?© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
MUCHAS GRACIAS!
https://github.com/PiConsulting
info@piconsulting.com.ar
© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados

Más contenido relacionado

PDF
BigDataSummitPeru - Big Data y Hadoop
PDF
2016 ULL Cabildo KEEDIO - BigData
PDF
2016 ULL Cabildo KEEDIO - Como se empieza
PPTX
BDAS-2017 | Organizaciones Orientadas al dato
PDF
Big Data, Big Customer Value, Big Results
PPTX
Proyectos Big Data en Healthcare
PPTX
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
PDF
Gestiona la Información en Tu Empresa
BigDataSummitPeru - Big Data y Hadoop
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - Como se empieza
BDAS-2017 | Organizaciones Orientadas al dato
Big Data, Big Customer Value, Big Results
Proyectos Big Data en Healthcare
BDAS-2017 | Deep Learning para Extracción de Valor en Contenidos Digitales
Gestiona la Información en Tu Empresa

La actualidad más candente (20)

PPTX
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
PDF
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
PDF
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
PPTX
Análisis de Datos para toma de Decisiones (BIG DATA)
PDF
Estado del arte del BI | Jornada Madrid 2014 | UOC
PPTX
Big Data: conceptos generales e impacto en los negocios
PDF
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
PPTX
Big data lead colmex
PDF
Datlas HackMTY - Choques y siniestros Agosto 2020
PPTX
Anatomía de un proyecto de Big Data
PPTX
Big data presentación
PDF
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
PPTX
Big Data en el entorno Bancario
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPTX
Big Data y el sector salud
PPTX
Business Intelligence vs. BiG Data
PPTX
Cómo implementar una solución Big Data
PPTX
Claves para entender el actual big data
PPTX
Bigdata, Business Intelligence? = PowerBi
PDF
Cómo empezar a implementar proyectos Big Data en tu organización
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Paradigmas de Procesamiento en Big Data: Arquitecturas y Tecnologías aplicadas
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
Análisis de Datos para toma de Decisiones (BIG DATA)
Estado del arte del BI | Jornada Madrid 2014 | UOC
Big Data: conceptos generales e impacto en los negocios
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
Big data lead colmex
Datlas HackMTY - Choques y siniestros Agosto 2020
Anatomía de un proyecto de Big Data
Big data presentación
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Big Data en el entorno Bancario
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Big Data y el sector salud
Business Intelligence vs. BiG Data
Cómo implementar una solución Big Data
Claves para entender el actual big data
Bigdata, Business Intelligence? = PowerBi
Cómo empezar a implementar proyectos Big Data en tu organización
Publicidad

Similar a Data Science - Analítica Predictiva y Evolución de BI (20)

PDF
Las batallas del data scientist
PPTX
Desayuno Data science - Aplicaciones en métricas & Analytics
PPTX
Clase 01 - Introducción a la ciencia de datos
PDF
Como-empezar-tu-carrera-en-data-science.pdf
PPTX
De qué hablamos cuando hablamos de Data Science
PDF
Data-Driven Organizations
PDF
Retos y oportunidades de la Analítica avanzada y Big Data en la industria
PDF
DATA SCIENCE PLATFORM
PDF
La Modelización Predictiva como Herramienta de Innovación
PDF
201510_TransformacionBigData
PPTX
1.Unidad1. Fundamentos DataScience.pptx
PDF
Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016
DOCX
Proyecto libreria Iztaccihuatl.docx
PDF
Data Science: Correlación curricular
PPTX
Transformación Digital – Ciencia de datos el siguiente nivel
PPTX
BDAS-2017 | Innovación con base en datos en Silicon Valley y Latino América
PPTX
Manuel Allegue - eRetail Week Blended [Professional] Experience 2023
PPTX
Big data presentacion diapositiva
PDF
Presentación Metric Arts 2012
PDF
Minería de Datos: Qué significa realmente y ejemplos de utilización
Las batallas del data scientist
Desayuno Data science - Aplicaciones en métricas & Analytics
Clase 01 - Introducción a la ciencia de datos
Como-empezar-tu-carrera-en-data-science.pdf
De qué hablamos cuando hablamos de Data Science
Data-Driven Organizations
Retos y oportunidades de la Analítica avanzada y Big Data en la industria
DATA SCIENCE PLATFORM
La Modelización Predictiva como Herramienta de Innovación
201510_TransformacionBigData
1.Unidad1. Fundamentos DataScience.pptx
Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016
Proyecto libreria Iztaccihuatl.docx
Data Science: Correlación curricular
Transformación Digital – Ciencia de datos el siguiente nivel
BDAS-2017 | Innovación con base en datos en Silicon Valley y Latino América
Manuel Allegue - eRetail Week Blended [Professional] Experience 2023
Big data presentacion diapositiva
Presentación Metric Arts 2012
Minería de Datos: Qué significa realmente y ejemplos de utilización
Publicidad

Último (20)

PDF
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PPTX
Curso de generación de energía mediante sistemas solares
PDF
CyberOps Associate - Cisco Networking Academy
DOCX
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
DOCX
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
DOCX
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk
PPTX
la-historia-de-la-medicina Edna Silva.pptx
PPT
Protocolos de seguridad y mecanismos encriptación
PDF
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PPTX
Sesion 1 de microsoft power point - Clase 1
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PDF
Distribucion de frecuencia exel (1).pdf
PDF
MANUAL de recursos humanos para ODOO.pdf
PDF
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
PPTX
Presentacion de Alba Curso Auditores Internos ISO 19011
PPTX
Historia Inteligencia Artificial Ana Romero.pptx
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
Curso de generación de energía mediante sistemas solares
CyberOps Associate - Cisco Networking Academy
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk
la-historia-de-la-medicina Edna Silva.pptx
Protocolos de seguridad y mecanismos encriptación
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
Estrategia de Apoyo de Daylin Castaño (5).pdf
Sesion 1 de microsoft power point - Clase 1
Power Point Nicolás Carrasco (disertación Roblox).pptx
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
Distribucion de frecuencia exel (1).pdf
MANUAL de recursos humanos para ODOO.pdf
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
Presentacion de Alba Curso Auditores Internos ISO 19011
Historia Inteligencia Artificial Ana Romero.pptx
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx

Data Science - Analítica Predictiva y Evolución de BI

  • 1. DATA SCIENCE Analítica Predictiva y Evolución de BI © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 2. PATRICIO DEL BOCA PI Co-founder @pdelboca pdelboca@piconsulting.com.ar RODRIGO BOBADILLA Data Scientist en PI @rodrib_08 rbobadilla@piconsulting.com.ar © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 3. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes. Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 4. OBJETIVO Dar una introducción a Data Science para conocer los conceptos y características fundamentales de esta disciplina. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 5. Data Science? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 6. 2015 © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 7. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 8. Bajos costos de procesamiento, © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 9. algoritmos, © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 10. y muchos datos. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 11. Nuevo rol, Data Scientist. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 12. We define Data Science as managing the process that can transform hypothesis and data into actionable predictions. - Practical Data Science with R - ” © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 13. EVOLUCION DE BI ¿Cuál es el perfil de los clientes que han dejado de usar mi servicio? ¿Qué clientes van a abandonar el uso de mi servicio? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 14. Detección de Fraude © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 15. Detección de Patrones y Segmentación de Clientes © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 16. Sistemas de Recomendación © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 17. Predicción de Abandono de Marca © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 18. Predicción de Demanda © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 19. Scoring y Riesgo Crediticio © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 20. Mantenimiento Predictivo © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 21. ALGORITMOS SUPERVISADOS Clasificación Regresión Motores de Recomendación Detección de Anomalías ALGORITMOS NO SUPERVISADOS Clustering Clustering Jerárquico Mapas auto organizados Descubrimiento de Patrones © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 22. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 23. CICLO DE VIDA - CRISP-DM, el “SCRUM” de Data Science. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 24. 1. COMPRENSIÓN DEL NEGOCIO - ¿Cuál es el valor que aporta al negocio este proyecto? - ¿Cómo puede saber que sus resultados son precisos o efectivos? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 25. 2. COMPRENSIÓN DE LOS DATOS - Análisis de completitud de los datos - Búsqueda de errores - Análisis de valores extremos © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 26. 3. PREPARACIÓN DE LOS DATOS - Limpieza de datos - Feature engineering © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 27. 4. MODELADO - Generalización que busca explicar y predecir el comportamiento de los datos - “Essentially all models are wrong, but some are useful.” George E. P. Box © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 28. 5. EVALUACIÓN - ¿Resuelve el modelo el objetivo que planteamos? - Análisis de los errores y planificación de próximos pasos - Si es demasiado bueno para ser verdad, probablemente lo sea! (Overfitting) © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 29. 6. IMPLEMENTACIÓN - Presentación de los resultados a todos los stakeholders - Implementación del modelos en producción - Tiempo Real vs Procesamiento en Lote - Cloud vs On-Premise © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 30. At the end of the day, it is usually how we frame the problem, not the tools and techniques that we use to answer it, that determines how valuable our work is. - Thinking with Data, Max Shron - ” © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 31. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 32. AGENDA Objetivo Introducción ¿Qué es Data Science? Soluciones y usos más frecuentes Ciclo de Vida de un Proyecto Demo Thumb Rules Big Data Conclusiones Preguntas © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 33. THUMB-RULES - ¿Hay datos disponibles? ¿Etiquetados? ¿Cuántos? - ¿Qué tipo de datos? - Garbage In, Garbage Out. - Iniciar siempre con una prueba de concepto. - ¿Está el negocio comprometido con un trabajo de calidad? © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 34. BIG DATA “Big Data es cuando el tamaño comienza a ser un problema y los datos ya no pueden ser procesados en una sola terminal de cómputo.” - Consenso Popular - © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 35. CONCLUSIONES - Data Science es un proceso Iterativo que requiere de muchas idas y vueltas entre cada etapa - Lo más importante en un Proyecto es la pregunta que se hace para abordar una problemática concreta, más aún que las herramientas que se usen. © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 36. PREGUNTAS? ?© Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados
  • 37. MUCHAS GRACIAS! https://github.com/PiConsulting info@piconsulting.com.ar © Copyright 2015 - Pi Data Strategy & Consulting. Todos los derechos reservados