SlideShare una empresa de Scribd logo
Ya eres parte de la evolución
Solid Day
#MachineLearning para
Organizaciones
Jesus Ramos
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos
#sgnext
Y éste qué?
- Ingeniero de Software de nacimiento (ITESM).
- Econometrista Financiero por azar (Unottingham +
UWashington).
- Estadístico Computacional por convicción (Coursera, a mucha
honra).
- Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc)
para levantar sus capacidades analíticas.
- Co fundador de @TheDataPub, comunidad dedicada a reventar
la burbuja y detener el tren del m*** del ML y del Pig Data.
- Gamer los sábados (PSN: xuxoramos).
- Foodie los domingos.
En qué ando?
Lo feo del
#MachineLearning…
#MachineLearning Bubble
Machine
Learning
Montaña rusa sin freno…
$232mmdd
Gran Inversión
4%
Stats/Maths/Prog
Poco skill Mala cultura
Governance:
Datos rehenes
de cabal de IT
…y sin cinturón!
El freno para esta montaña
rusa…
Roadmap+Riesgos para la
banda
Skill
Si eres dev,
métele a stats+maths.
Si eres de maths+stats,
métele a dev.
Biz Intimacy
Olvídate de la
Herramienta.
Enfócate en el
lenguaje de negocio.
Operational
No entregues reportes,
entrega APIs.
Sin contexto
==
Hacer la pregunta
equivocada
No hay
escalamiento
Mala predicción +
Alto sesgo
==
Perder dinero/
lastimar personas
Etapa
Riesgo
Roadmap+Riesgos para orgs
Etapa
Riesgo
DWH
Todos los datos
en 1 solo lugar.
Gov’nance
Total apertura y
con conexiones
SelfServ-BI
Que gente de negocio
se sirva reportes sola.
Mayor sesgo
+
sin
observer
effect
DataScience
==
Reporteo/BI
Correlación
==
Causalidad
Cómo desaceleramos?
Con definiciones (ni peiper).
#MachineLearning para todos
SW Dev
Máquina
(de estados, no la
compu)
Datos
Función/
Programa
Salida
Machine/Statistical Learning Supervisado
Máquina
(de estados, no la
compu)
Salida*
Datos
Función/
Programa**
Contexto
Contexto
* No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
#MachineLearning para todos
Objetivo 1: identificar patrones
Error Total
#MachineLearning para todos
Objetivo 2: reducir el error de la función
Error de Predicción
Error del Fenómeno
(Varianza)
Sesgo/Bias
Reducción: más/menos
variables
Reducción: más datos/
observaciones.
Reducción:
CONTEXTO!
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Tipos: Clasificación
#MachineLearning para todos
Tipos: Regresión
#MachineLearning para todos
Tipos: Clustering == Clasificación Sin Output
#MachineLearning para todos
Tipos: Dimensionality Redux/Feature Engineering
#MachineLearning para todos
Y cuál uso?
(Los que me den menos varianza y menos bias)
#MachineLearning para todos
Metodología
Describir
Qué me parece
interesante de
mi dataset?
Explorar
Qué research
question quiero
Hacerle a mi
dataset?
Inferir
La respuesta
puede
generalizarse?
Predecir
La respuesta
aplica a nuevas
observaciones?
- Distribuciones
- Media
- Moda
- Kurtosis
- Clustering
- Kohonen
- DBSCAN
- Multidim
Scaling
- Hypo Test
- GLM
- ANOVA
- MSE
- Random
Forest
- Boosting
- Bagging
- Deep
Learning
ML ML
Cross Validation
Data
Training Test Validation
70% 20% 10%
N veces: TestValidation TestValidation TestValidation
Ya le quitamos el m*me al
tren. Ahora...?
Aplicaciones!
B*n*m*x
• Conversión de cliente de nómina a TC en 29%.
• $2.7mmdp en revenue al año desde 2010.
• Cómo lo hizo?
• Clasificación!
f(edad, género, monto, antigüedad, …) = tiene TC
Predictores / variables independientes variable respuesta /
dependiente
UPS
• Ahorro de combustible haciendo que camiones
sólo den vuelta a la derecha.
• Ahorro de $47mdd al año.
• Cómo lo hicieron?
• Diseño de experimentos!
Exploratorio -> Recolección de datos -> Hypothesis
Testing -> GLMs -> Clasificación
T*lc*l
• Identificación de usrs consumiendo $7K MXN
semanales de tiempo aire en prepago.
• Creación de producto de crédito de tiempo aire
de hasta $2K.
• $4mmdp al año de revenue.
• Cómo lo hicieron?
• Clustering!
Multidimensional Scaling + K-means/DBSCAN
Western Union
• Prevención de fraude en remesas en
automático y personalizado.
• $32mdd en ahorro operativo en 2012. $21mdd
son de transacciones detenidas al momento.
• Cómo le hicieron?
• Clasificación!
• Similar a algoritmos de spam/ham.
Gr*p* *xp*ns**n
• Bajar bounce rate y mantener al visitante en
sitios de las marcas del grupo.
• Aumentar ad impressions.
• Cómo lo están haciendo?
• Recommender Systems!
Clasif 1 + Clasif 2 + … + Clasif N
Qué
música
prefiere?
Qué
comida
prefiere?
Qué
pelis
ha visto?
Y las startups?
En la delantera!
• Konfio, Kueski, Prestadero + ensemble
learning = credit scoring.
• Piggo + multidimensional scaling + DBSCAN =
recomendación de inversiones.
• Klustera + Filtros Kalman (un tipo de
regresión) = ubicación exacta de gente en
centros comerciales.
• HolaGus + deep convolutional neural networks
= clasificación de texto.
Caso interesante: FullHarvest
• Time Series de granjas y huertos en tiempo de
cosecha.
• Clasificación para planeación de recolecciones.
• Optimización heurística para trazo de rutas.
• Regresión múltiple para planeación de demanda y
pricing.
• Ensemble para transformación y saber qué
producir.
• Optimización para ruta de entrega.
Bottomline:
El ML ayuda a escalar
servicios para el 99%!
Qué puede salir mal?
Todo!
#MachineLearning Flops
• Google Flu Trends – Contexto = predicción
fallida de AH1N1 en Francia.
• Google Image Classifier – Contexto = 2
afroamericanos taggeados como ‘gorilas’.
• Walmart + Modelo complejo de alta varianza =
productos en mal estado vendidos a clientes.
• Wall Street + Model simple de alto bias = crisis
hipotecaria de 2008
• T*lc*l – Contexto = Préstamos a sospechosos.
Concluyendo…
Soy dev…cómo le entro al
ML?
• Comienza por prepararte en mates y estadística. Leete
“Think Stats” de Allen Downey.
• Acércate al depto de mates de tu universidad. Seguro
encuentras diplomados en mates.
• MOOCs: “Data Science Specialization” de Coursera es la
opción.
• Síguele con el de Andrew Ng de Stanford. Piérdele el miedo
a la notación formal.
• No te cases ni con Python ni con R. Usa ambos.
• No te cases con ningún algoritmo. Primero pregunta “qué
quiero lograr?”
• Context is KING!
Y si ya le se al ML?
• Platícanos tu proyecto en ramos.cardona@gmail.com
para que lo presentes en @thedatapub.
• Mándame un correo. Andamos reclutando!
• Sé humilde ante lo que te falta por aprender.
• Acércate a disciplinas complementarias de la ciencia
de datos: topología, diseño de experimentos,
optimización, visualización y storytelling.
• Comparte tu conocimiento. Ojalá seas tú el próximo
acá arriba!
¿Preguntas?
Grax!
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos

Más contenido relacionado

PDF
Estadistica y Machine Learning para Todos
PDF
Big Data, Big Disappointment (@TheDataPub)
PDF
WTF with Big Data?
PDF
Inferencia Estadística para Periodistas
PDF
Entrepreneurship with Data, Machine Learning and AI
PDF
Historias de Ciencia de Datos desde la Trinchera
PDF
Algorithmic Transparency
PPTX
El Periodismo de Datos y su implantación en España
Estadistica y Machine Learning para Todos
Big Data, Big Disappointment (@TheDataPub)
WTF with Big Data?
Inferencia Estadística para Periodistas
Entrepreneurship with Data, Machine Learning and AI
Historias de Ciencia de Datos desde la Trinchera
Algorithmic Transparency
El Periodismo de Datos y su implantación en España

Destacado (10)

PDF
Big Data, Big Disappointment
PDF
Big Data, Big Flops: The gag reel of algorithms
PDF
Mexican Landscape of DS & AI
PDF
Wonderful Wacky Wide World of Data Analysis Applications
PDF
Coursera_MachineLearning
PDF
Articulo de cuda
PDF
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
PPTX
Dana Clinic Management System (DCMS)
PPTX
A CTO's Guide to Scaling Organizations
PDF
Leading the Data Asset Management Team: CDO or Top Data Job?
Big Data, Big Disappointment
Big Data, Big Flops: The gag reel of algorithms
Mexican Landscape of DS & AI
Wonderful Wacky Wide World of Data Analysis Applications
Coursera_MachineLearning
Articulo de cuda
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Dana Clinic Management System (DCMS)
A CTO's Guide to Scaling Organizations
Leading the Data Asset Management Team: CDO or Top Data Job?
Publicidad

Similar a Machine Learning For Organizations (20)

PDF
Machine Learning para Organizaciones
PDF
Solid Day - Machine learning para organizaciones
PPTX
Fundamentos Minería Datos
PDF
Emprendiendo con Data Science, Machine Learning y AI
PPTX
EMBD2018 | Autotuning en modelos de Machine Learning
PPTX
Data Mining
PDF
Ultrapersonalización en la Web
PDF
moda-para-datos-agrupados-y-desagrupados.pdf
PDF
Big data centrologic 2016
PDF
El futuro de marketing an america latina (16 9)
PDF
With Big Data comes Great Power
PDF
Tópicos de Big Data - Introducción
PDF
Diapositivas-Curso-Fundamentos-Minitab.pdf
PPTX
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
PDF
Machine Learning in Investment Management March 2018
PDF
Globalstar simplex services (logistic summit)
PPTX
Machine Learning grup nteligencia a.pptx
PPTX
Machine Learning Inteligencia Artif.pptx
PPTX
El Big Data en la dirección comercial: market(ing) intelligence
Machine Learning para Organizaciones
Solid Day - Machine learning para organizaciones
Fundamentos Minería Datos
Emprendiendo con Data Science, Machine Learning y AI
EMBD2018 | Autotuning en modelos de Machine Learning
Data Mining
Ultrapersonalización en la Web
moda-para-datos-agrupados-y-desagrupados.pdf
Big data centrologic 2016
El futuro de marketing an america latina (16 9)
With Big Data comes Great Power
Tópicos de Big Data - Introducción
Diapositivas-Curso-Fundamentos-Minitab.pdf
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Machine Learning in Investment Management March 2018
Globalstar simplex services (logistic summit)
Machine Learning grup nteligencia a.pptx
Machine Learning Inteligencia Artif.pptx
El Big Data en la dirección comercial: market(ing) intelligence
Publicidad

Último (20)

PPTX
EPCE_EXCEL 365 CURSO DE ENTRENAMIENTO.pptx
PPTX
FACTORES DE RIESGOS EN EL PERSONAL DE SALUD 2 DIAPOSITIVAS.pptx
PDF
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
PDF
Manual de presentacion de la aplicacion Plugbot
PDF
REPORTE DE INCIDENCIA DELICTIVA IRAPUATO 1ER SEMESTRE 2025
PDF
NORMA_1887_LEY_27269_Modificada_por_LEY_27310.pdf
PDF
lavado de manos_20250805_212935_0000.pdf
PPTX
fisioterapia 6 semestre - ---- serealizo
PPTX
Abdomen HosAESREBBweubeehkrhkqhrkhehrjktil.pptx
PDF
EJERCICIOS RESUELTOS CON SOLVER EXCEL.pdf
PDF
Pobreza porcentual en el mundo y sistemas socioeconómicos (1945-2030).pdf
PDF
Presentacion Gestion de Recursos DIA 1.pdf
PPTX
Presentacion Capacitacion RC y RG (5).pptx
PDF
Actualización en el uso de uterotónico.pdf
PDF
dhjhfjhjcnjhghhhdfhuhhchchuuhuhduhduddyhdu
PPT
TRATA Y TRÁFICO DE PERSONAS defensoría del pueblo
PPTX
Precio optimo de venta para un emprendimiento familiar
PPTX
Inteligencia_Artificialdelosk_Mujer.pptx
PPTX
Las buenas costumbres en la familiaaaaaaa
PPTX
Milder Antoni quirhuayo segura trabajo de investigación .pptx
EPCE_EXCEL 365 CURSO DE ENTRENAMIENTO.pptx
FACTORES DE RIESGOS EN EL PERSONAL DE SALUD 2 DIAPOSITIVAS.pptx
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
Manual de presentacion de la aplicacion Plugbot
REPORTE DE INCIDENCIA DELICTIVA IRAPUATO 1ER SEMESTRE 2025
NORMA_1887_LEY_27269_Modificada_por_LEY_27310.pdf
lavado de manos_20250805_212935_0000.pdf
fisioterapia 6 semestre - ---- serealizo
Abdomen HosAESREBBweubeehkrhkqhrkhehrjktil.pptx
EJERCICIOS RESUELTOS CON SOLVER EXCEL.pdf
Pobreza porcentual en el mundo y sistemas socioeconómicos (1945-2030).pdf
Presentacion Gestion de Recursos DIA 1.pdf
Presentacion Capacitacion RC y RG (5).pptx
Actualización en el uso de uterotónico.pdf
dhjhfjhjcnjhghhhdfhuhhchchuuhuhduhduddyhdu
TRATA Y TRÁFICO DE PERSONAS defensoría del pueblo
Precio optimo de venta para un emprendimiento familiar
Inteligencia_Artificialdelosk_Mujer.pptx
Las buenas costumbres en la familiaaaaaaa
Milder Antoni quirhuayo segura trabajo de investigación .pptx

Machine Learning For Organizations

  • 1. Ya eres parte de la evolución Solid Day #MachineLearning para Organizaciones Jesus Ramos @xuxoramos ramos.cardona@gmail.com linkedin.com/in/xuxoramos #sgnext
  • 2. Y éste qué? - Ingeniero de Software de nacimiento (ITESM). - Econometrista Financiero por azar (Unottingham + UWashington). - Estadístico Computacional por convicción (Coursera, a mucha honra). - Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc) para levantar sus capacidades analíticas. - Co fundador de @TheDataPub, comunidad dedicada a reventar la burbuja y detener el tren del m*** del ML y del Pig Data. - Gamer los sábados (PSN: xuxoramos). - Foodie los domingos.
  • 6. Montaña rusa sin freno… $232mmdd Gran Inversión 4% Stats/Maths/Prog Poco skill Mala cultura Governance: Datos rehenes de cabal de IT
  • 8. El freno para esta montaña rusa…
  • 9. Roadmap+Riesgos para la banda Skill Si eres dev, métele a stats+maths. Si eres de maths+stats, métele a dev. Biz Intimacy Olvídate de la Herramienta. Enfócate en el lenguaje de negocio. Operational No entregues reportes, entrega APIs. Sin contexto == Hacer la pregunta equivocada No hay escalamiento Mala predicción + Alto sesgo == Perder dinero/ lastimar personas Etapa Riesgo
  • 10. Roadmap+Riesgos para orgs Etapa Riesgo DWH Todos los datos en 1 solo lugar. Gov’nance Total apertura y con conexiones SelfServ-BI Que gente de negocio se sirva reportes sola. Mayor sesgo + sin observer effect DataScience == Reporteo/BI Correlación == Causalidad
  • 12. #MachineLearning para todos SW Dev Máquina (de estados, no la compu) Datos Función/ Programa Salida Machine/Statistical Learning Supervisado Máquina (de estados, no la compu) Salida* Datos Función/ Programa** Contexto Contexto * No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
  • 13. #MachineLearning para todos Objetivo 1: identificar patrones
  • 14. Error Total #MachineLearning para todos Objetivo 2: reducir el error de la función Error de Predicción Error del Fenómeno (Varianza) Sesgo/Bias Reducción: más/menos variables Reducción: más datos/ observaciones. Reducción: CONTEXTO!
  • 19. #MachineLearning para todos Tipos: Clustering == Clasificación Sin Output
  • 20. #MachineLearning para todos Tipos: Dimensionality Redux/Feature Engineering
  • 21. #MachineLearning para todos Y cuál uso? (Los que me den menos varianza y menos bias)
  • 22. #MachineLearning para todos Metodología Describir Qué me parece interesante de mi dataset? Explorar Qué research question quiero Hacerle a mi dataset? Inferir La respuesta puede generalizarse? Predecir La respuesta aplica a nuevas observaciones? - Distribuciones - Media - Moda - Kurtosis - Clustering - Kohonen - DBSCAN - Multidim Scaling - Hypo Test - GLM - ANOVA - MSE - Random Forest - Boosting - Bagging - Deep Learning ML ML
  • 23. Cross Validation Data Training Test Validation 70% 20% 10% N veces: TestValidation TestValidation TestValidation
  • 24. Ya le quitamos el m*me al tren. Ahora...? Aplicaciones!
  • 25. B*n*m*x • Conversión de cliente de nómina a TC en 29%. • $2.7mmdp en revenue al año desde 2010. • Cómo lo hizo? • Clasificación! f(edad, género, monto, antigüedad, …) = tiene TC Predictores / variables independientes variable respuesta / dependiente
  • 26. UPS • Ahorro de combustible haciendo que camiones sólo den vuelta a la derecha. • Ahorro de $47mdd al año. • Cómo lo hicieron? • Diseño de experimentos! Exploratorio -> Recolección de datos -> Hypothesis Testing -> GLMs -> Clasificación
  • 27. T*lc*l • Identificación de usrs consumiendo $7K MXN semanales de tiempo aire en prepago. • Creación de producto de crédito de tiempo aire de hasta $2K. • $4mmdp al año de revenue. • Cómo lo hicieron? • Clustering! Multidimensional Scaling + K-means/DBSCAN
  • 28. Western Union • Prevención de fraude en remesas en automático y personalizado. • $32mdd en ahorro operativo en 2012. $21mdd son de transacciones detenidas al momento. • Cómo le hicieron? • Clasificación! • Similar a algoritmos de spam/ham.
  • 29. Gr*p* *xp*ns**n • Bajar bounce rate y mantener al visitante en sitios de las marcas del grupo. • Aumentar ad impressions. • Cómo lo están haciendo? • Recommender Systems! Clasif 1 + Clasif 2 + … + Clasif N Qué música prefiere? Qué comida prefiere? Qué pelis ha visto?
  • 31. En la delantera! • Konfio, Kueski, Prestadero + ensemble learning = credit scoring. • Piggo + multidimensional scaling + DBSCAN = recomendación de inversiones. • Klustera + Filtros Kalman (un tipo de regresión) = ubicación exacta de gente en centros comerciales. • HolaGus + deep convolutional neural networks = clasificación de texto.
  • 32. Caso interesante: FullHarvest • Time Series de granjas y huertos en tiempo de cosecha. • Clasificación para planeación de recolecciones. • Optimización heurística para trazo de rutas. • Regresión múltiple para planeación de demanda y pricing. • Ensemble para transformación y saber qué producir. • Optimización para ruta de entrega.
  • 33. Bottomline: El ML ayuda a escalar servicios para el 99%!
  • 34. Qué puede salir mal? Todo!
  • 35. #MachineLearning Flops • Google Flu Trends – Contexto = predicción fallida de AH1N1 en Francia. • Google Image Classifier – Contexto = 2 afroamericanos taggeados como ‘gorilas’. • Walmart + Modelo complejo de alta varianza = productos en mal estado vendidos a clientes. • Wall Street + Model simple de alto bias = crisis hipotecaria de 2008 • T*lc*l – Contexto = Préstamos a sospechosos.
  • 37. Soy dev…cómo le entro al ML? • Comienza por prepararte en mates y estadística. Leete “Think Stats” de Allen Downey. • Acércate al depto de mates de tu universidad. Seguro encuentras diplomados en mates. • MOOCs: “Data Science Specialization” de Coursera es la opción. • Síguele con el de Andrew Ng de Stanford. Piérdele el miedo a la notación formal. • No te cases ni con Python ni con R. Usa ambos. • No te cases con ningún algoritmo. Primero pregunta “qué quiero lograr?” • Context is KING!
  • 38. Y si ya le se al ML? • Platícanos tu proyecto en ramos.cardona@gmail.com para que lo presentes en @thedatapub. • Mándame un correo. Andamos reclutando! • Sé humilde ante lo que te falta por aprender. • Acércate a disciplinas complementarias de la ciencia de datos: topología, diseño de experimentos, optimización, visualización y storytelling. • Comparte tu conocimiento. Ojalá seas tú el próximo acá arriba!

Notas del editor