SlideShare una empresa de Scribd logo
Kaggle: Coupon Purchase Prediction.
Predecir que es lo que los clientes quieren antes que ellos.
Alejandro Tobon
Karen Viviana Torres
Roby Rubiano
Sistemas de recomendación
El Premio Netflix era un concurso abierto para el mejor algoritmo
de recomendación.
Premio un millón de dólares.
Amazon cuenta con un algoritmo personalizado de recomendación
que ellos llaman filtrado colaborativo ítem a ítem.
Fue desarrollado en casa y esta patentado en los
Estados Unidos.
Los videos recomendados representaron aproximadamente el 60%
de los clics en la página principal.
Se encontró la tasa de clics (CTR) se incrementó en un 207% para
los videos recomendados.
Un sistema de recomendación es un sistema inteligente que
proporciona a los usuarios una serie de sugerencias
personalizadas
Contenido
 Antecedentes
 Solución propuesta
Contenido
 Antecedentes
 Solución propuesta
Antecedentes
 Ponpare es un sitio web muy parecido a
Groupon.
 Ponpane el es sitio web líder en Japón,
que ofrece grandes descuentos de todo
tipo, desde el yoga, hasta sushi gourmet
 Por medio del uso de la información
histórica de compras y el
comportamiento de navegación, se
quiere predecir que cupones el cliente
va a comprar en un período
determinado de tiempo
 Se utilizarán los modelos resultantes
para mejorar el sistema de
recomendación actual.
Contenido
 Antecedentes
 Solución propuesta
Solución propuesta:
Planteamiento
Clientes y
cupones
 Información Histórica de
compras.
 Información de histórica
de navegación.
 Información detallada
de los groupones
 Datos demográficos del
cliente
Modelo
Analítico
El modelo entrega como resultado por cada cliente la lista de los 10
cupones mas propensos a la compra.
Modelo Analítico Fases
Calculo de similitud de
usuarios.
Esta medida depende de los
productos que compren en
común.
Vector de preferencias de cada
usuario.
VP: vector que contiene la
proporción de cuponesque
compro o visito con sus
características
Se emiten recomendaciones
Se mide la calidad y efectividad
del modelo
1
2
3
4
Diana
Pilar
Modelo Analítico: Similitud
La medida de similitud es un indador de 0 a 1, donde 1 significa que
compraron lo mismo y 0 significa lo contrario
Modelo Analítico: Vector de
preferencias de su comunidad
Cada variable que se define en el vector tiene un peso.
Diana
• 20% de los cupones los compro en SPA
• 40% de los cupones los comro en restaurantes.
• 50% de los cupones los compro en Bogota
• 40% de los cupones costaban menos de 50.000
Pilar……..
Arturo ……..
Modelo Analítico: Calidad
 Se entrena con todos los registros que están entre
las fechas (2011-07-01 to 2012-06-16), casi un año.
 Se mide la calidad con las compras que se
efectuaron entre (2011-06-13 to 2012-06-23)
 Se debe encontrar la combinación de pesos en el
vector de preferencias que maximizan la métrica de
calidad del modelo
 La métrica que se utiliza es la MAP@10

Más contenido relacionado

PPT
PPTX
PDF
Situación de tumaco 18 agos 15
PPT
Control de costes bancarios y productos de inversión de riesgo
PPT
Integración tecnología
PPTX
Presentación expo salud
PDF
Termoselladora De Bolsas De Plástico Económica MSLL doscientos
PPTX
Web 2.0
Situación de tumaco 18 agos 15
Control de costes bancarios y productos de inversión de riesgo
Integración tecnología
Presentación expo salud
Termoselladora De Bolsas De Plástico Económica MSLL doscientos
Web 2.0

Destacado (20)

PDF
El tresor del_ter (1)
PDF
Introducción a dropbox
PPTX
Tecnologia Educativa
PDF
LÍNEAS ESTRATÉGICAS EN EL MARCO DEL PROCESO CURRICULAR VENEZOLANO
PDF
Presentación smartbusiness
PDF
PPTX
servidores
PPTX
Contabilidad
PDF
Universidad autonoma de los andes
PPTX
El turismo del ecuador por María Esperanza Loor
PDF
La comunicación escrita
PPTX
Hardware sara
PPTX
Mitosis & meiosis
PPTX
Componentes de un proyecto
PPTX
PPTX
Plataforma virtual gratis karen y frida
PPTX
Trabajo colaborativo
PPTX
Tecnología.
PDF
Investigaciones 4º eso
PPTX
eloy alfaro
El tresor del_ter (1)
Introducción a dropbox
Tecnologia Educativa
LÍNEAS ESTRATÉGICAS EN EL MARCO DEL PROCESO CURRICULAR VENEZOLANO
Presentación smartbusiness
servidores
Contabilidad
Universidad autonoma de los andes
El turismo del ecuador por María Esperanza Loor
La comunicación escrita
Hardware sara
Mitosis & meiosis
Componentes de un proyecto
Plataforma virtual gratis karen y frida
Trabajo colaborativo
Tecnología.
Investigaciones 4º eso
eloy alfaro
Publicidad

Similar a Kaggle: Coupon Purchase Prediction (12)

PDF
Sistemas de recomendación & Big Data
DOCX
Proyecto individual - Introducción a la ciencia de datos
PDF
Proyecto de evaluación de pares
PDF
Personalización automática en la era del turismo inteligente y el big data
PDF
Sistemas de recomendación: tipos y evaluación
PPTX
conceptos
 
PPTX
clasificasionyprediccion
 
PPTX
pyc
 
PPTX
clasifipredic
PDF
Modelo-de-Recomendacion-Filtrado-Basado-en-Contenido.pdf.pdf
PPTX
SISTEMAS DE RECOMENDACIÓN.pptx
Sistemas de recomendación & Big Data
Proyecto individual - Introducción a la ciencia de datos
Proyecto de evaluación de pares
Personalización automática en la era del turismo inteligente y el big data
Sistemas de recomendación: tipos y evaluación
conceptos
 
clasificasionyprediccion
 
pyc
 
clasifipredic
Modelo-de-Recomendacion-Filtrado-Basado-en-Contenido.pdf.pdf
SISTEMAS DE RECOMENDACIÓN.pptx
Publicidad

Más de Big Data Colombia (19)

PDF
An introduction to deep reinforcement learning
PDF
Machine learning applied in health
PDF
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
PDF
Analysis of your own Facebook friends’ data structure through graphs
PDF
Lo datos cuentan su historia
PDF
Entornos Naturalmente Inteligentes
PPTX
Modelamiento predictivo y medicina
PDF
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
PDF
Deep learning: el renacimiento de las redes neuronales
PDF
IPython & Jupyter
PDF
Cloud computing: Trends and Challenges
PPTX
Machine learning y Kaggle
PPTX
Fraud Analytics
PDF
Data crunching con Spark
PPT
Introducción al Datawarehousing
PDF
Análisis Explotatorio de Datos: Dejad que la data hable.
PDF
Big Data para mortales
PDF
Salud, dinero, amor y big data
PDF
Business Analytics: ¡La culpa es del BIG data!
An introduction to deep reinforcement learning
Machine learning applied in health
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Analysis of your own Facebook friends’ data structure through graphs
Lo datos cuentan su historia
Entornos Naturalmente Inteligentes
Modelamiento predictivo y medicina
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Deep learning: el renacimiento de las redes neuronales
IPython & Jupyter
Cloud computing: Trends and Challenges
Machine learning y Kaggle
Fraud Analytics
Data crunching con Spark
Introducción al Datawarehousing
Análisis Explotatorio de Datos: Dejad que la data hable.
Big Data para mortales
Salud, dinero, amor y big data
Business Analytics: ¡La culpa es del BIG data!

Último (20)

PDF
HIS. UNI R03 - CLAVES.pdfG05 HIS.UNI- MUNI.pdf
PDF
Posiciones de EUA en el ranking de los países por IDH ajustado por desigualda...
PPTX
Las buenas costumbres en la familiaaaaaaa
PPTX
PUBLICANDO PRESENTACIONES EN SliderShare
PPTX
Curriculo-de-Matematica-Un-Enfoque-por-Competencias.pptx
PPTX
GUERRAS INTERNACIONALES DE BOLIVIA .pptx
PDF
Administracion y contabilidad publica 1era clase
PPTX
Grupo 008_Equipo 3_Evidencia 4_ATDI.pptx
PPTX
D.4. Ciclos Mq While - Máximos - Mínimos.pptx
DOCX
Estratégias de Ventas para WhatsApp paso a paso
PDF
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
PPTX
Los-origenes-modernos-del-atletismo (1).pptx
PDF
Estrategia de apoyo realizada por juan pablo
PDF
PROGRAMA CALEB. par la iglesia es un programa
PPTX
DICTÁMENES MÉDICO-PSIQUIÁTRICOS Y PSICOLÓGICOS FORENSES 6.pptx
PPTX
CRITERIOS DE UN SERVICIO DE INTENSIVO presen.pptx
PPSX
Unidad II - Diseño de una solucion 2025.ppsx
PDF
Ranking de potencias geopolíticas revisado al año (2025).pdf
PPTX
El adjetivo, descripción de la categoría gramatical
PPTX
Diabetes Mellitus, funciones, partes y tipos
HIS. UNI R03 - CLAVES.pdfG05 HIS.UNI- MUNI.pdf
Posiciones de EUA en el ranking de los países por IDH ajustado por desigualda...
Las buenas costumbres en la familiaaaaaaa
PUBLICANDO PRESENTACIONES EN SliderShare
Curriculo-de-Matematica-Un-Enfoque-por-Competencias.pptx
GUERRAS INTERNACIONALES DE BOLIVIA .pptx
Administracion y contabilidad publica 1era clase
Grupo 008_Equipo 3_Evidencia 4_ATDI.pptx
D.4. Ciclos Mq While - Máximos - Mínimos.pptx
Estratégias de Ventas para WhatsApp paso a paso
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
Los-origenes-modernos-del-atletismo (1).pptx
Estrategia de apoyo realizada por juan pablo
PROGRAMA CALEB. par la iglesia es un programa
DICTÁMENES MÉDICO-PSIQUIÁTRICOS Y PSICOLÓGICOS FORENSES 6.pptx
CRITERIOS DE UN SERVICIO DE INTENSIVO presen.pptx
Unidad II - Diseño de una solucion 2025.ppsx
Ranking de potencias geopolíticas revisado al año (2025).pdf
El adjetivo, descripción de la categoría gramatical
Diabetes Mellitus, funciones, partes y tipos

Kaggle: Coupon Purchase Prediction

  • 1. Kaggle: Coupon Purchase Prediction. Predecir que es lo que los clientes quieren antes que ellos. Alejandro Tobon Karen Viviana Torres Roby Rubiano
  • 2. Sistemas de recomendación El Premio Netflix era un concurso abierto para el mejor algoritmo de recomendación. Premio un millón de dólares. Amazon cuenta con un algoritmo personalizado de recomendación que ellos llaman filtrado colaborativo ítem a ítem. Fue desarrollado en casa y esta patentado en los Estados Unidos. Los videos recomendados representaron aproximadamente el 60% de los clics en la página principal. Se encontró la tasa de clics (CTR) se incrementó en un 207% para los videos recomendados. Un sistema de recomendación es un sistema inteligente que proporciona a los usuarios una serie de sugerencias personalizadas
  • 5. Antecedentes  Ponpare es un sitio web muy parecido a Groupon.  Ponpane el es sitio web líder en Japón, que ofrece grandes descuentos de todo tipo, desde el yoga, hasta sushi gourmet  Por medio del uso de la información histórica de compras y el comportamiento de navegación, se quiere predecir que cupones el cliente va a comprar en un período determinado de tiempo  Se utilizarán los modelos resultantes para mejorar el sistema de recomendación actual.
  • 7. Solución propuesta: Planteamiento Clientes y cupones  Información Histórica de compras.  Información de histórica de navegación.  Información detallada de los groupones  Datos demográficos del cliente Modelo Analítico El modelo entrega como resultado por cada cliente la lista de los 10 cupones mas propensos a la compra.
  • 8. Modelo Analítico Fases Calculo de similitud de usuarios. Esta medida depende de los productos que compren en común. Vector de preferencias de cada usuario. VP: vector que contiene la proporción de cuponesque compro o visito con sus características Se emiten recomendaciones Se mide la calidad y efectividad del modelo 1 2 3 4
  • 9. Diana Pilar Modelo Analítico: Similitud La medida de similitud es un indador de 0 a 1, donde 1 significa que compraron lo mismo y 0 significa lo contrario
  • 10. Modelo Analítico: Vector de preferencias de su comunidad Cada variable que se define en el vector tiene un peso. Diana • 20% de los cupones los compro en SPA • 40% de los cupones los comro en restaurantes. • 50% de los cupones los compro en Bogota • 40% de los cupones costaban menos de 50.000 Pilar…….. Arturo ……..
  • 11. Modelo Analítico: Calidad  Se entrena con todos los registros que están entre las fechas (2011-07-01 to 2012-06-16), casi un año.  Se mide la calidad con las compras que se efectuaron entre (2011-06-13 to 2012-06-23)  Se debe encontrar la combinación de pesos en el vector de preferencias que maximizan la métrica de calidad del modelo  La métrica que se utiliza es la MAP@10

Notas del editor

  • #2: Ponpare
  • #3: Amazon: Jeffrey Bezos 1994
  • #12: where if the denominator is zero, the result is set zero; P(k) means the precision at cut-off k in the item list, i.e., the ratio of number of users followed up to the position k over the number k, and P(k) equals 0 when k -th item is not followed upon recommendation; n = 10 (1) If the user follows recommended nodes #1 and #3 along with another node that wasn't recommend, then ap@10 = (1/1 + 2/3)/3 ≈ 0.56 (2) If the user follows recommended nodes #1 and #2 along with another node that wasn't recommend, then ap@10 = (1/1 + 2/2)/3 ≈ 0.67 (3) If the user follows recommended nodes #1 and #3 and has no other missing nodes, then ap@10 = (1/1 + 2/3)/2 ≈ 0.83