SlideShare una empresa de Scribd logo
Introducción a la Minería de Datos con
KNIME
Diego García Saiz
Grupo de Lenguajes y Sistemas Informáticos
Universidad de Cantabria
Introducción al contexto
• Gran cantidad de datos almacenados.
– Por parte de empresas: marketing, hipermercados, servicios, banca,
etc.
– Redes Sociales: Facebook, Twitter, Tuenti, LinkedIn y otras muchas.
– Y en muchos otros ámbitos: educativo (cursos online), institucional
(gobierno), médico, etc.
• ¿Qué hacer con todos esos datos?.
– Podríamos utilizarlos para extraer información relevante con el objeto
de ayudar a la toma de decisiones en el negocio, el gobierno, la
sanidad, la educación, las ventas, etc.
– Para esto tenemos la Minería de Datos.
¿Minería de datos?. Definición formal
• El datamining (minería de datos), es el conjunto de
técnicas y tecnologías que permiten explotar grandes
cantidades de datos, de forma automática o
semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado
contexto.
Más simple: La minería de datos es un
proceso consistente en entender y
extraer información relevante para el
desarrollo del negocio, que no podría
extraerse de otra forma.
No sólo de extraer patrones viven los
“datamineros”: CRIPS-DM
Tres grandes grupos de
algoritmos
• Agrupamiento (clustering).
• Reglas de asociación.
• Predicción: clasificación.
Open Analytics - Minería de Datos con Knime
• Conjunto de técnicas de Minería de Datos que determinan y
asignan a los individuos o elementos a grupos de similares
características.
Consiste en diferenciar subconjuntos de datos que comparten
características similares.
Ejemplos:
Identificar rasgo comunes en un conjunto de la población.
Conocer los perfiles de usuario de una red social según su actividad.
Agrupar los datos de una campaña de marketing según sus
resultados.
Agrupamiento (clustering)
Agrupamiento (clustering)
• Ejemplo: Perfil de los alumnos en un curso online según la
actividad que desarrollan.
• Como datos, tenemos su actividad en el curso medida
en, tiempo dedicado, número de sesiones, mensajes
leídos y escritos en el foro, etc.
Resultado de aplicar el algoritmo Kmeans:
Agrupamiento (clustering)
Cluster 1 Cluster 2 Cluster 3
Tiempo Dedicado 103 minutos 1394 minutos 2917 minutos
Sesiones
dedicadas
10 sesiones 90 sesiones 180 sesiones
Mensajes escritos
en el foro
5 mensajes 21 mensajes 89 mensajes
Predicción: Clasificación
• Consiste en la clasificación de individuos en una determinada clase
según sus características, para poder inferir predicciones en un
futuro.
• Ejemplos: conocer si…
• … un cliente realizará una hipoteca con el banco.
• … las acciones de una empresa subirán o bajarán en un
momento determinado.
• … un alumno aprobará o suspenderá una asignatura.
• … un paciente tiene una enfermedad concreta según sus
síntomas y datos personales.
• … una campaña de marketing tendrá éxito.
Clasificación: Ejemplo
• Campaña de marketing telefónico de un banco portugués para
atraer clientes de depósitos
• Conjunto de datos: contiene información personal de los
clientes, incluida información bancaria.
• Estado civil (soltero, casado, viudo)
• Sexo
• Edad
• Mes de la llamada
• Hipotecas del cliente en el banco
• Créditos del cliente en el banco
• Y muchos otros…
• Resultados (algoritmo C4.5)
Duration
Age
Married
Credit
<= 211
> 211 and <=645
Clasificación: Ejemplo
> 645
> 60
yes
yesno
no
…
…
…
NO
YES
NO
Open Analytics - Minería de Datos con Knime

Más contenido relacionado

PPT
OpenAnalytics - Minería de datos por Diego García (Unican)
PDF
Presentación Minería de Datos
PPT
Mineria de Datos
PDF
Minería de datos
PPT
Gerenciar el Conocimiento -CRM - Data Mining
DOCX
Mineria de datos
PDF
Mineria de datos
PPTX
Presentacion data mining (mineria de datos)- base de datos
OpenAnalytics - Minería de datos por Diego García (Unican)
Presentación Minería de Datos
Mineria de Datos
Minería de datos
Gerenciar el Conocimiento -CRM - Data Mining
Mineria de datos
Mineria de datos
Presentacion data mining (mineria de datos)- base de datos

La actualidad más candente (20)

PPS
Técnicas y Modelos de Mineria de Datos
PDF
Mineria de datos
PDF
Minería de datos
PPTX
Mineria de datos
PPTX
Mineria de datos
PPTX
Mineria De Datos Secuenciales
PPT
¿Qué es un modelo predictivo y para qué vale?
PDF
Mineria de datos
PPT
Mineria De Datos
PPTX
Mineria de datos
DOCX
Mineria de datos
PPTX
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
PPSX
Aplicación de aprendizaje automático en minería de datos
PDF
Minería de Datos: Qué significa realmente y ejemplos de utilización
PPTX
Minería de datos
PDF
Minería de datos
PPTX
Minería de datos y kdd
PPTX
Minería de datos
PPT
Nociones Básicas de la Minería de Datos
Técnicas y Modelos de Mineria de Datos
Mineria de datos
Minería de datos
Mineria de datos
Mineria de datos
Mineria De Datos Secuenciales
¿Qué es un modelo predictivo y para qué vale?
Mineria de datos
Mineria De Datos
Mineria de datos
Mineria de datos
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Aplicación de aprendizaje automático en minería de datos
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de datos
Minería de datos
Minería de datos y kdd
Minería de datos
Nociones Básicas de la Minería de Datos
Publicidad

Similar a Open Analytics - Minería de Datos con Knime (20)

PPT
Minería de datos y textos
PPTX
Modelos De Data Mining
PPTX
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
PPTX
Mineria de datos
PPT
Data Mining Snoop Consulting Arg
PPTX
Responsabilidad Ambiental Empresarial 1 - Copia - Copia.pptx
PPTX
Presentación sobre la clasificación inteligente de datos
PDF
aplicaciones de minería de datos
PPTX
aporte de la educación 29-04 (2) (2).pptx
PDF
Que es Datamining y su importancia el rpoceso de KDD
PPTX
Session01.pptx
PDF
PPTX
Aplicación del clustering Aplicación del clustering .pptx
PDF
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
DOCX
Data mining triptico
PPTX
Data mining
PPT
MD: Clase9
PDF
Inteligencia de los Negocios en la Empresa Moderna
PDF
Fundamentos de Data Mining con R
PDF
Minería de Datos - Unidad 1
Minería de datos y textos
Modelos De Data Mining
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Mineria de datos
Data Mining Snoop Consulting Arg
Responsabilidad Ambiental Empresarial 1 - Copia - Copia.pptx
Presentación sobre la clasificación inteligente de datos
aplicaciones de minería de datos
aporte de la educación 29-04 (2) (2).pptx
Que es Datamining y su importancia el rpoceso de KDD
Session01.pptx
Aplicación del clustering Aplicación del clustering .pptx
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Data mining triptico
Data mining
MD: Clase9
Inteligencia de los Negocios en la Empresa Moderna
Fundamentos de Data Mining con R
Minería de Datos - Unidad 1
Publicidad

Más de OpenAnalytics Spain (15)

PPTX
OpenAnalytics 04/2015 - Watson vs R
PDF
OpenAnalytics 04/2015 - Data Analytics con Hadoop
PPT
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
PDF
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
PDF
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
PDF
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
PDF
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
PDF
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
PPT
OpenAnalytics - Taller de Talend 13/02/2014
PDF
OpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
PDF
OpenAnalytics - Periodismo de datos por Hugo Garrido
PDF
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
PDF
OpenAnalytics - BigData por Ivan del Prado (Datasalt)
PPTX
Open Analytics - Data Quality por Diego Martínez de Equifax
PPTX
OpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
OpenAnalytics - Periodismo de datos por Hugo Garrido
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
OpenAnalytics - BigData por Ivan del Prado (Datasalt)
Open Analytics - Data Quality por Diego Martínez de Equifax
OpenAnalytics - Business Intelligence por Emilio Arias

Último (20)

PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PPTX
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PDF
Plantilla para Diseño de Narrativas Transmedia.pdf
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PPT
Que son las redes de computadores y sus partes
PDF
MÓDULO DE CALOR DE GRADO DE MEDIO DE FORMACIÓN PROFESIONAL
PDF
Calidad desde el Docente y la mejora continua .pdf
PPT
introduccion a las_web en el 2025_mejoras.ppt
PDF
CyberOps Associate - Cisco Networking Academy
PDF
SAP Transportation Management para LSP, TM140 Col18
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PPTX
Presentación de Redes de Datos modelo osi
PPTX
Presentación PASANTIAS AuditorioOO..pptx
DOCX
Zarate Quispe Alex aldayir aplicaciones de internet .docx
PPTX
Sesion 1 de microsoft power point - Clase 1
PDF
taller de informática - LEY DE OHM
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
Propuesta BKP servidores con Acronis1.pptx
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
Plantilla para Diseño de Narrativas Transmedia.pdf
Power Point Nicolás Carrasco (disertación Roblox).pptx
Que son las redes de computadores y sus partes
MÓDULO DE CALOR DE GRADO DE MEDIO DE FORMACIÓN PROFESIONAL
Calidad desde el Docente y la mejora continua .pdf
introduccion a las_web en el 2025_mejoras.ppt
CyberOps Associate - Cisco Networking Academy
SAP Transportation Management para LSP, TM140 Col18
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
historia_web de la creacion de un navegador_presentacion.pptx
Presentación de Redes de Datos modelo osi
Presentación PASANTIAS AuditorioOO..pptx
Zarate Quispe Alex aldayir aplicaciones de internet .docx
Sesion 1 de microsoft power point - Clase 1
taller de informática - LEY DE OHM
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN

Open Analytics - Minería de Datos con Knime

  • 1. Introducción a la Minería de Datos con KNIME Diego García Saiz Grupo de Lenguajes y Sistemas Informáticos Universidad de Cantabria
  • 2. Introducción al contexto • Gran cantidad de datos almacenados. – Por parte de empresas: marketing, hipermercados, servicios, banca, etc. – Redes Sociales: Facebook, Twitter, Tuenti, LinkedIn y otras muchas. – Y en muchos otros ámbitos: educativo (cursos online), institucional (gobierno), médico, etc. • ¿Qué hacer con todos esos datos?. – Podríamos utilizarlos para extraer información relevante con el objeto de ayudar a la toma de decisiones en el negocio, el gobierno, la sanidad, la educación, las ventas, etc. – Para esto tenemos la Minería de Datos.
  • 3. ¿Minería de datos?. Definición formal • El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explotar grandes cantidades de datos, de forma automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Más simple: La minería de datos es un proceso consistente en entender y extraer información relevante para el desarrollo del negocio, que no podría extraerse de otra forma.
  • 4. No sólo de extraer patrones viven los “datamineros”: CRIPS-DM
  • 5. Tres grandes grupos de algoritmos • Agrupamiento (clustering). • Reglas de asociación. • Predicción: clasificación.
  • 7. • Conjunto de técnicas de Minería de Datos que determinan y asignan a los individuos o elementos a grupos de similares características. Consiste en diferenciar subconjuntos de datos que comparten características similares. Ejemplos: Identificar rasgo comunes en un conjunto de la población. Conocer los perfiles de usuario de una red social según su actividad. Agrupar los datos de una campaña de marketing según sus resultados. Agrupamiento (clustering)
  • 9. • Ejemplo: Perfil de los alumnos en un curso online según la actividad que desarrollan. • Como datos, tenemos su actividad en el curso medida en, tiempo dedicado, número de sesiones, mensajes leídos y escritos en el foro, etc. Resultado de aplicar el algoritmo Kmeans: Agrupamiento (clustering) Cluster 1 Cluster 2 Cluster 3 Tiempo Dedicado 103 minutos 1394 minutos 2917 minutos Sesiones dedicadas 10 sesiones 90 sesiones 180 sesiones Mensajes escritos en el foro 5 mensajes 21 mensajes 89 mensajes
  • 10. Predicción: Clasificación • Consiste en la clasificación de individuos en una determinada clase según sus características, para poder inferir predicciones en un futuro. • Ejemplos: conocer si… • … un cliente realizará una hipoteca con el banco. • … las acciones de una empresa subirán o bajarán en un momento determinado. • … un alumno aprobará o suspenderá una asignatura. • … un paciente tiene una enfermedad concreta según sus síntomas y datos personales. • … una campaña de marketing tendrá éxito.
  • 11. Clasificación: Ejemplo • Campaña de marketing telefónico de un banco portugués para atraer clientes de depósitos • Conjunto de datos: contiene información personal de los clientes, incluida información bancaria. • Estado civil (soltero, casado, viudo) • Sexo • Edad • Mes de la llamada • Hipotecas del cliente en el banco • Créditos del cliente en el banco • Y muchos otros…
  • 12. • Resultados (algoritmo C4.5) Duration Age Married Credit <= 211 > 211 and <=645 Clasificación: Ejemplo > 645 > 60 yes yesno no … … … NO YES NO