SlideShare una empresa de Scribd logo
Minería de DatosPara el común de los mortalesAntonio sotoDirector General@antoniosql
AgendaIntroducción a Minería de DatosProblemas de NegocioTareas de Minería de DatosCiclo de un Proyecto de Minería de DatosClasificación de Algoritmos de SQL Server Data MiningMinería de Datos aplicada utilizando Office
Introducción a Minería de Datos¿Qué es la Minería de Datos?Problemas de NegocioTareas de Minería de DatosCiclo de un Proyecto de Minería de Datos
¿Qué es la Minería de Datos?«La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos»Fuente: Wikipedia
¿Qué es la Minería de Datos? (II)Deducir conocimiento examinando los datos y realizando predicciones«examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables»«conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,….OLAP: Análisis orientado al modeloDM: Análisis orientado al datoNombres alternativos: Análisis Predictivo
Problemas de NegocioGeneración de Recomendaciones¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes?Detección de anomalíasDetección de fraudeAnálisis de Rotación¿Qué clientes son más proclives de irse a la competencia?Gestión de Riesgos¿Debería de concederse el préstamo?Segmentación de clientesClasificación de nuestros clientesAnuncios OrientadosPersonalización de anuncios, contenido,…Previsión¿Cuánto venderemos el próximo trimestre?
Tareas de Minería de Datos (I)ClasificaciónSe asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase.Se busca un modelo que describa el atributo clase como una función de los atributos de salidaAgrupaciónTambién conocido como segmentaciónIdentifica grupos naturales basándose en un conjunto de atributosAsociaciónTambién conocido como análisis de cesta de la compraRegresiónSimilar a clasificación pero con el objetivo de buscar patrones para determinar un valor numéricoEj.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad
Tareas de Minería de Datos (II)PrevisiónLa entrada es un conjunto de valores a lo largo del tiempo de los que extrae valores futurosAnálisis de secuenciaBusca patrones en una serie de eventos llamada secuenciaEj. Secuencia de navegación en WebAnálisis de desviacionesBusca casos «raros» diferentes a los demás
Ciclo de un Proyecto de Minería (I)Formulación del Problema de NegocioRecolección de DatosLimpieza y Transformación de DatosTransformación numéricaAgrupaciónAgregaciónManejo de valores «perdidos»Eliminar os «extremos»Creación del ModeloSelección del AlgoritmoPrueba y Error en muchos casos
Ciclo de un Proyecto de Minería (II)Evaluación del ModeloEvaluar la fiabilidad del modelo dentro de nuestro negocioReporting y PredicciónIntegración en AplicacionesGestión del ModeloDependiendo del escenario puede ser muy volátilPlanificar «Entrenamiento»
Clasificación de Algoritmos
Clasificación de AlgoritmosTipos de AlgoritmosAlgoritmos de SQL Server Data MiningClasificación de Algoritmos
Tipos de AlgoritmosDe Forecasting. Dada una tendencia ¿Cuál es la previsión?Supervisados. Conocemos la respuesta ¿Qué está correlacionado?No Supervisados. Desconocemos la respuesta ¿Cuáles son los grupos?
Algoritmos (I)Decision TreesEl más popularUtilizado para clasificaciónClusteringEncuentra agrupaciones naturalesSequence ClusteringAgrupo una secuencia de eventos discretos en grupos naturales basado en similaridadEntender como los visitantes usan una web
Algoritmos (II)Naïve BayesClasificación en escenarios similares a Decision TreesLinear RegressionEncuentra la mejor línea recta posible a través de una serie de puntosUsado para análisis predictivoLogistic RegressionSe adapta a un factor exponencialUsado para análisis predictivo
Algoritmos (III)Association RulesAnálisis de Cesta de la compraTime SeriesAlgoritmo de previsión usado para previsión a corto y largo plazoPodemos usar varios escenarios para predecir escenarios “what if”Neural NetworkTareas de Clasificación y RegresiónMás sofisticado que Decision Trees y Naïve Bayes
Clasificación de Algoritmos
Minería de Datos en Office
Minería de Datos en OfficeTareas de Preparación de DatosTableAnalysis ToolsData Modeling ToolsVisoresTesteo y Validación
Tareas de Preparación de DatosExplorar DatosInformación estadística básicaLimpieza de datosOutliersRe-labelDatos de Ejemplo
Preparando los datos
TableAnalysis Tools (I)
TableAnalysis Tools(II)
Data Modeling Tools
Data Modeling Tools
Visores de ModeloCluster DiagramCluster ProfilesOtrosVisores Decision tree
Neural   network
 Association rules
 Time seriesCluster CharacteristicsCluster Discrimination

Más contenido relacionado

PPTX
Mineria de datos
PPT
Mineria De Datos
PPT
MIneria de datos
DOCX
Mineria de datos
PPTX
Presentacion data mining (mineria de datos)- base de datos
PDF
Minería de datos
PDF
Mineria de datos
Mineria de datos
Mineria De Datos
MIneria de datos
Mineria de datos
Presentacion data mining (mineria de datos)- base de datos
Minería de datos
Mineria de datos

La actualidad más candente (20)

PDF
Presentación Minería de Datos
PDF
Mineria de datos
PDF
Minería de datos
PPTX
Mineria de datos
PPT
OpenAnalytics - Minería de datos por Diego García (Unican)
PPT
Nociones Básicas de la Minería de Datos
PPT
Mineria de Datos
PPTX
Mineria de datos
PPTX
Mineria de datos - UAGRM
DOCX
Mineria de datos
PDF
Minería de Datos: Qué significa realmente y ejemplos de utilización
PPTX
Mineria de Datos Parte I
PPT
mineria de datos
PDF
Minería de datos
PPTX
Mineria de datos
PPTX
Mineria de datos
PDF
Mineria de datos
PPTX
Algoritmos de minería de datos
PPTX
Minería de datos y kdd
PDF
La Minería de Datos y herramientas de análisis
Presentación Minería de Datos
Mineria de datos
Minería de datos
Mineria de datos
OpenAnalytics - Minería de datos por Diego García (Unican)
Nociones Básicas de la Minería de Datos
Mineria de Datos
Mineria de datos
Mineria de datos - UAGRM
Mineria de datos
Minería de Datos: Qué significa realmente y ejemplos de utilización
Mineria de Datos Parte I
mineria de datos
Minería de datos
Mineria de datos
Mineria de datos
Mineria de datos
Algoritmos de minería de datos
Minería de datos y kdd
La Minería de Datos y herramientas de análisis
Publicidad

Destacado (14)

PPT
Minería de datos Presentación
PPTX
Data Mining
PPTX
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
PPT
¿Qué es un modelo predictivo y para qué vale?
PDF
Modelos predictivos: datos, métodos, problemas y aplicaciones
PPTX
Mineria de datos
PPTX
Mineria de datos
PDF
Mapa conceptual mineria de datos 1
PPTX
Minería de datos
PPT
Make Growth Happen for all Employees
PPT
Minería de datos en redes sociales
PPTX
Diapositivas
PPTX
Técnicas e Instrumentos de Recolección de Datos
PPTX
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
Minería de datos Presentación
Data Mining
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
¿Qué es un modelo predictivo y para qué vale?
Modelos predictivos: datos, métodos, problemas y aplicaciones
Mineria de datos
Mineria de datos
Mapa conceptual mineria de datos 1
Minería de datos
Make Growth Happen for all Employees
Minería de datos en redes sociales
Diapositivas
Técnicas e Instrumentos de Recolección de Datos
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
Publicidad

Similar a Minería de datos (20)

PPTX
Técnicas de análisis de datos
DOC
Marisela labrador
DOCX
Web mining
PDF
La minería de datos en el proceso de KDD
PDF
Introducción al Data Mining
DOCX
Data mining triptico
PPT
Minería de datos y textos
PPTX
Introducción al análisis predictivo con SQL Server
PDF
Conceptos en Ciencia de Datos
PPT
Introduccion a mineria de datos
PPT
Unidad2 Bases De Datos Para L Toma De Desiciones
PDF
Minería de Datos. Introducción
PDF
PDF
Mineria de datos ensayo
PDF
Revista TicNews Marzo 2015
PPT
20080506 Acm Jornadas Ponencia
DOCX
La Minería de Datos en la Analítica Predictiva
PPT
MD: Clase9
DOCX
Mineria de datos ok
PPTX
Mineria de datos
Técnicas de análisis de datos
Marisela labrador
Web mining
La minería de datos en el proceso de KDD
Introducción al Data Mining
Data mining triptico
Minería de datos y textos
Introducción al análisis predictivo con SQL Server
Conceptos en Ciencia de Datos
Introduccion a mineria de datos
Unidad2 Bases De Datos Para L Toma De Desiciones
Minería de Datos. Introducción
Mineria de datos ensayo
Revista TicNews Marzo 2015
20080506 Acm Jornadas Ponencia
La Minería de Datos en la Analítica Predictiva
MD: Clase9
Mineria de datos ok
Mineria de datos

Más de Antonio Soto (8)

PDF
Gestiona la Información en Tu Empresa
PDF
Azure360
PDF
Power BI para desarrolladores netcoreconf
PPTX
Exchange2010
PDF
04 Soluciones Basadas En Enterprise Search
PDF
Sql Data Services
PDF
Trucos, OptimizacióN Y Buenas PráCticas Para Sql
PPT
Migración SQL Server
Gestiona la Información en Tu Empresa
Azure360
Power BI para desarrolladores netcoreconf
Exchange2010
04 Soluciones Basadas En Enterprise Search
Sql Data Services
Trucos, OptimizacióN Y Buenas PráCticas Para Sql
Migración SQL Server

Último (20)

PDF
Estrategia de apoyo tecnología miguel angel solis
PPTX
REDES INFORMATICAS REDES INFORMATICAS.pptx
PDF
Maste clas de estructura metálica y arquitectura
PPTX
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PPT
El-Gobierno-Electrónico-En-El-Estado-Bolivia
PDF
Diapositiva proyecto de vida, materia catedra
PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PDF
taller de informática - LEY DE OHM
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
DOCX
Zarate Quispe Alex aldayir aplicaciones de internet .docx
PPTX
Presentación de Redes de Datos modelo osi
PDF
CyberOps Associate - Cisco Networking Academy
PPTX
Presentación PASANTIAS AuditorioOO..pptx
PDF
Calidad desde el Docente y la mejora continua .pdf
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PPT
introduccion a las_web en el 2025_mejoras.ppt
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PDF
Plantilla para Diseño de Narrativas Transmedia.pdf
Estrategia de apoyo tecnología miguel angel solis
REDES INFORMATICAS REDES INFORMATICAS.pptx
Maste clas de estructura metálica y arquitectura
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
El-Gobierno-Electrónico-En-El-Estado-Bolivia
Diapositiva proyecto de vida, materia catedra
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
taller de informática - LEY DE OHM
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
Zarate Quispe Alex aldayir aplicaciones de internet .docx
Presentación de Redes de Datos modelo osi
CyberOps Associate - Cisco Networking Academy
Presentación PASANTIAS AuditorioOO..pptx
Calidad desde el Docente y la mejora continua .pdf
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
historia_web de la creacion de un navegador_presentacion.pptx
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
introduccion a las_web en el 2025_mejoras.ppt
Power Point Nicolás Carrasco (disertación Roblox).pptx
Plantilla para Diseño de Narrativas Transmedia.pdf

Minería de datos

  • 1. Minería de DatosPara el común de los mortalesAntonio sotoDirector General@antoniosql
  • 2. AgendaIntroducción a Minería de DatosProblemas de NegocioTareas de Minería de DatosCiclo de un Proyecto de Minería de DatosClasificación de Algoritmos de SQL Server Data MiningMinería de Datos aplicada utilizando Office
  • 3. Introducción a Minería de Datos¿Qué es la Minería de Datos?Problemas de NegocioTareas de Minería de DatosCiclo de un Proyecto de Minería de Datos
  • 4. ¿Qué es la Minería de Datos?«La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos»Fuente: Wikipedia
  • 5. ¿Qué es la Minería de Datos? (II)Deducir conocimiento examinando los datos y realizando predicciones«examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables»«conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,….OLAP: Análisis orientado al modeloDM: Análisis orientado al datoNombres alternativos: Análisis Predictivo
  • 6. Problemas de NegocioGeneración de Recomendaciones¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes?Detección de anomalíasDetección de fraudeAnálisis de Rotación¿Qué clientes son más proclives de irse a la competencia?Gestión de Riesgos¿Debería de concederse el préstamo?Segmentación de clientesClasificación de nuestros clientesAnuncios OrientadosPersonalización de anuncios, contenido,…Previsión¿Cuánto venderemos el próximo trimestre?
  • 7. Tareas de Minería de Datos (I)ClasificaciónSe asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase.Se busca un modelo que describa el atributo clase como una función de los atributos de salidaAgrupaciónTambién conocido como segmentaciónIdentifica grupos naturales basándose en un conjunto de atributosAsociaciónTambién conocido como análisis de cesta de la compraRegresiónSimilar a clasificación pero con el objetivo de buscar patrones para determinar un valor numéricoEj.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad
  • 8. Tareas de Minería de Datos (II)PrevisiónLa entrada es un conjunto de valores a lo largo del tiempo de los que extrae valores futurosAnálisis de secuenciaBusca patrones en una serie de eventos llamada secuenciaEj. Secuencia de navegación en WebAnálisis de desviacionesBusca casos «raros» diferentes a los demás
  • 9. Ciclo de un Proyecto de Minería (I)Formulación del Problema de NegocioRecolección de DatosLimpieza y Transformación de DatosTransformación numéricaAgrupaciónAgregaciónManejo de valores «perdidos»Eliminar os «extremos»Creación del ModeloSelección del AlgoritmoPrueba y Error en muchos casos
  • 10. Ciclo de un Proyecto de Minería (II)Evaluación del ModeloEvaluar la fiabilidad del modelo dentro de nuestro negocioReporting y PredicciónIntegración en AplicacionesGestión del ModeloDependiendo del escenario puede ser muy volátilPlanificar «Entrenamiento»
  • 12. Clasificación de AlgoritmosTipos de AlgoritmosAlgoritmos de SQL Server Data MiningClasificación de Algoritmos
  • 13. Tipos de AlgoritmosDe Forecasting. Dada una tendencia ¿Cuál es la previsión?Supervisados. Conocemos la respuesta ¿Qué está correlacionado?No Supervisados. Desconocemos la respuesta ¿Cuáles son los grupos?
  • 14. Algoritmos (I)Decision TreesEl más popularUtilizado para clasificaciónClusteringEncuentra agrupaciones naturalesSequence ClusteringAgrupo una secuencia de eventos discretos en grupos naturales basado en similaridadEntender como los visitantes usan una web
  • 15. Algoritmos (II)Naïve BayesClasificación en escenarios similares a Decision TreesLinear RegressionEncuentra la mejor línea recta posible a través de una serie de puntosUsado para análisis predictivoLogistic RegressionSe adapta a un factor exponencialUsado para análisis predictivo
  • 16. Algoritmos (III)Association RulesAnálisis de Cesta de la compraTime SeriesAlgoritmo de previsión usado para previsión a corto y largo plazoPodemos usar varios escenarios para predecir escenarios “what if”Neural NetworkTareas de Clasificación y RegresiónMás sofisticado que Decision Trees y Naïve Bayes
  • 18. Minería de Datos en Office
  • 19. Minería de Datos en OfficeTareas de Preparación de DatosTableAnalysis ToolsData Modeling ToolsVisoresTesteo y Validación
  • 20. Tareas de Preparación de DatosExplorar DatosInformación estadística básicaLimpieza de datosOutliersRe-labelDatos de Ejemplo
  • 26. Visores de ModeloCluster DiagramCluster ProfilesOtrosVisores Decision tree
  • 27. Neural network
  • 29. Time seriesCluster CharacteristicsCluster Discrimination
  • 30. Testeo y ValidaciónAccuracy ChartClassification MatrixProfit Chart
  • 31. ResumenProblemas de Negocio que podemos resolverQue Tareas de Minería de Datos podemos aplicarCiclo de un Proyecto de Minería de DatosClasificación de Algoritmos de SQL Server Data MiningMinería de Datos aplicada utilizando Office
  • 32. Minería de DatosPara el común de los mortalesAntonio sotoDirector General@antoniosql

Notas del editor

  • #5: http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datosLet’s start with some basic definitions. First of all, what the term “Data Mining” means? A well-formed definition was posted by Michael J. A. Berry & Gordon S. Linoff: “Data mining is the process of exploration and analysis, by automatic or semiautomatic means, of large quantities of data in order to discover patterns and rules”. Another definition comes from Raplh Kimball: “Data mining is a collection of powerful analysis techniques for making sense out of very large datasets”. Of course we have a definition by another guru, Bill Inmon: “Data Mining / Data Exploration is the usage of historical data to discover and exploit important business relationships”.
  • #6: So we can say, we are deducing some hidden knowledge by examining, or training the data. Our unit of examination is called “case”, which can be interpreted as one appearance of an entity, or a row in a table. The knowledge is patterns and rules. In the process we are using attributes of a case, in the data mining terminology called “variables”. Additional goal of DM is to perform predictions based on found patterns.For better understanding we can compare Data Mining to OLAP. While OLAP is a model-driven analysis, where we build the model in advance (what if it is irrelevant?), the Data Mining is a data-driven analysis, where we search from the model in our data.
  • #8: Para cada uno de los problemas anteriores, podemos aplicar varias tareas. En algunos casos una respuesta será obvia con la aplicación de una única tarea. En otros casos será necesario explorar y combinar múltiples tareas para llegar a una solución.