SlideShare una empresa de Scribd logo
DATA MINING
KAROL PARDO
MIGUEL VALCERO
CORPORACION UNIVERSITARIA MINUTO DE DIOS
DATA MINING (MINERIA DE DATOS)
 Es un campo de las ciencias de la
computación referido al proceso que
intenta descubrir patrones en grandes
volúmenes de conjuntos de datos.1 Utiliza
los métodos de la inteligencia artificial,
aprendizaje automático, estadística y
sistemas de bases de datos.
OBJETIVO DEL DATA MINING
 El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior. Además de la etapa de
análisis en bruto, que involucra aspectos de bases de datos y de
gestión de datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de métricas de Intereses, de
consideraciones de la Teoría de la complejidad computacional, de
post-procesamiento de las estructuras descubiertas, de la
visualización y de la actualización en línea
FUNCIÓN
 La tarea de minería de datos real es el análisis automático
o semi-automático de grandes cantidades de datos para
extraer patrones interesantes hasta ahora desconocidos,
como los grupos de registros de datos (análisis clúster),
registros poco usuales (la detección de anomalías) y
dependencias (minería por reglas de asociación). Esto
generalmente implica el uso de técnicas de bases de datos
como los índices espaciales. Estos patrones pueden
entonces ser vistos como una especie de resumen de los
datos de entrada, y pueden ser utilizados en el análisis
adicional o, por ejemplo, en la máquina de aprendizaje y
análisis predictivo.
PROCESO
 Selección del conjunto de datos
 Análisis de las propiedades de los datos
 Transformación del conjunto de datos de entrada
 Seleccionar y aplicar la técnica de minería de datos
 Extracción de conocimiento
 Interpretación y evaluación de datos
Protocolo de un proyecto de minería de
datos
Un proyecto de minería de datos tiene varias fases necesarias que son,
esencialmente:
 Comprensión: del negocio y del problema que se quiere resolver.
 Determinación, obtención y limpieza: de los datos necesarios.
 Creación de modelos matemáticos.
 Validación, comunicación: de los resultados obtenidos.
 Integración: si procede, de los resultados en un sistema transaccional o
similar
Técnicas de minería de datos
Las técnicas más representativas son:
 Redes neuronales.- Son un paradigma de aprendizaje y procesamiento
automático inspirado en la forma en que funciona el sistema nervioso de los
animales.
 Regresión lineal.- Es la más utilizada para formar relaciones entre datos.
Rápida y eficaz pero insuficiente en espacios multidimensionales donde
puedan relacionarse más de 2 variables.
 Árboles de decisión.- Un árbol de decisión es un modelo de predicción
utilizado en el ámbito de la inteligencia artificial, sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolución de un problema.
 Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la variable de respuesta.
 Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie
de vectores según criterios habitualmente de distancia; se tratará de disponer
los vectores de entrada de forma que estén más cercanos aquellos que tengan
características comunes.
 Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en
común dentro de un determinado conjunto de datos.
Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican
en supervisados y no supervisados (Weiss y Indurkhya, 1998):
 Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de
ellos) desconocido a priori, a partir de otros conocidos.
 Algoritmos no supervisados (o del descubrimiento del conocimiento): se
descubren patrones y tendencias en los datos.
¿PREGUNTAS?
 ¿Qué es Data mining?
 ¿Cuál es su función importante?
 ¿Cuales son los tipos de técnica del Data mining
que hay?

Más contenido relacionado

PDF
Mineria de datos ensayo
PPTX
Técnicas más usadas en la mineria de datos
PPTX
Minería de datos
PPTX
Técnicas mineria de datos
PPS
Técnicas y Modelos de Mineria de Datos
DOCX
Mineria de datos ok
PPTX
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
PDF
Charla big data y data mining para gestión de información y bibliotecas
Mineria de datos ensayo
Técnicas más usadas en la mineria de datos
Minería de datos
Técnicas mineria de datos
Técnicas y Modelos de Mineria de Datos
Mineria de datos ok
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Charla big data y data mining para gestión de información y bibliotecas

La actualidad más candente (17)

PPTX
Técnicas de minería de datos
PPTX
Mineria de datos
PPTX
Algoritmos de minería de datos
PPTX
Presentacion mineria
PPTX
Minería de datos y kdd
PPTX
Técnicas de minería de datos
DOCX
Mineria de datos
PPT
Mineria de Datos
PDF
Modelamiento predictivo en Analítica Predictiva
PPTX
Mineria De Datos Secuenciales
PDF
Mineria de datos
PDF
Datamining y Machine Learning para Ciencias Biológicas
PDF
Mineria de datos
PPTX
Data mining
PPTX
PPTX
Data mining
PDF
Minería de datos
Técnicas de minería de datos
Mineria de datos
Algoritmos de minería de datos
Presentacion mineria
Minería de datos y kdd
Técnicas de minería de datos
Mineria de datos
Mineria de Datos
Modelamiento predictivo en Analítica Predictiva
Mineria De Datos Secuenciales
Mineria de datos
Datamining y Machine Learning para Ciencias Biológicas
Mineria de datos
Data mining
Data mining
Minería de datos
Publicidad

Destacado (9)

PPTX
Netiquetas
PPTX
Presentación netiqueta
PPTX
Netiqueta (diapositivas)
PPTX
Diapositivas de netiqueta
PPTX
E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.
PPT
Diapositivas de Netiquetas- MODIFICADAS
PDF
Tendencias Recientes en Data Mining
PPTX
Ejemplos de netiqueta
PPT
Datawarehouse1
Netiquetas
Presentación netiqueta
Netiqueta (diapositivas)
Diapositivas de netiqueta
E.R.P., Data Warehouse y C.R.M. unidos para tu empresa.
Diapositivas de Netiquetas- MODIFICADAS
Tendencias Recientes en Data Mining
Ejemplos de netiqueta
Datawarehouse1
Publicidad

Similar a Data mining (20)

DOCX
Mineria de datos
PPTX
Presentacion data mining (mineria de datos)- base de datos
PPTX
Exposicion mineria de datos - Franklin Rodríguez
PDF
MINERIA DE DATOS enfocado a ml cun 2024.pdf
DOCX
Monografia Data Mining
DOC
Marisela labrador
PDF
Minería de Datos. Introducción
PPTX
aporte de la educación 29-04 (2) (2).pptx
PDF
Mineria de datos-una_introduccion
PPTX
Mineria de datos
PPTX
Mineria de datos
PDF
Tecnicas de minera de datos CUN 2024.pdf
PDF
Herramientas de mineria_de_datos
PPTX
Míneria de datos
PPT
Mineria De Datos
PPT
Mineria1 2010
PDF
Data Mining , what is? And how is being used.
DOCX
Data mining triptico
PPTX
Mineria de Datos
Mineria de datos
Presentacion data mining (mineria de datos)- base de datos
Exposicion mineria de datos - Franklin Rodríguez
MINERIA DE DATOS enfocado a ml cun 2024.pdf
Monografia Data Mining
Marisela labrador
Minería de Datos. Introducción
aporte de la educación 29-04 (2) (2).pptx
Mineria de datos-una_introduccion
Mineria de datos
Mineria de datos
Tecnicas de minera de datos CUN 2024.pdf
Herramientas de mineria_de_datos
Míneria de datos
Mineria De Datos
Mineria1 2010
Data Mining , what is? And how is being used.
Data mining triptico
Mineria de Datos

Más de contaduria1234 (18)

PPTX
Redes sociales (1)
PPTX
Derechos de autor
PPTX
Gbi modding
PPTX
Presentación deep web
PPTX
DEEP WEB
PPTX
PPTX
Presentacion antivirus
PPTX
Los virus
PPTX
Comercio electronico exposición
PPTX
Voki exposición
PPTX
Gbi delitos informaticos exposición
PPTX
Crackers y hackers exposición
PPTX
aulas virtuales exposición
PPTX
Aulas virtuales
PPTX
Crackers y hackers
PPTX
Gbi delitos informaticos
PPTX
PPTX
Comercio electronico
Redes sociales (1)
Derechos de autor
Gbi modding
Presentación deep web
DEEP WEB
Presentacion antivirus
Los virus
Comercio electronico exposición
Voki exposición
Gbi delitos informaticos exposición
Crackers y hackers exposición
aulas virtuales exposición
Aulas virtuales
Crackers y hackers
Gbi delitos informaticos
Comercio electronico

Último (20)

PDF
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
PDF
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
DOCX
2 GRADO UNIDAD 5 - 2025.docx para primaria
PDF
GUIA DE: CANVA + INTELIGENCIA ARTIFICIAL
PDF
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
PDF
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
PPTX
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
PDF
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
PDF
ciencias-1.pdf libro cuarto basico niños
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PPT
Cosacos y hombres del Este en el Heer.ppt
PDF
Escuela Sabática 6. A través del Mar Rojo.pdf
DOCX
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
PDF
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
DOCX
V UNIDAD - PRIMER GRADO. del mes de agosto
PDF
Punto Critico - Brian Tracy Ccesa007.pdf
DOCX
V UNIDAD - SEGUNDO GRADO. del mes de agosto
PDF
OK OK UNIDAD DE APRENDIZAJE 5TO Y 6TO CORRESPONDIENTE AL MES DE AGOSTO 2025.pdf
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
Tomo 1 de biologia gratis ultra plusenmas
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
2 GRADO UNIDAD 5 - 2025.docx para primaria
GUIA DE: CANVA + INTELIGENCIA ARTIFICIAL
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
ciencias-1.pdf libro cuarto basico niños
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
Cosacos y hombres del Este en el Heer.ppt
Escuela Sabática 6. A través del Mar Rojo.pdf
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
V UNIDAD - PRIMER GRADO. del mes de agosto
Punto Critico - Brian Tracy Ccesa007.pdf
V UNIDAD - SEGUNDO GRADO. del mes de agosto
OK OK UNIDAD DE APRENDIZAJE 5TO Y 6TO CORRESPONDIENTE AL MES DE AGOSTO 2025.pdf

Data mining

  • 1. DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS
  • 2. DATA MINING (MINERIA DE DATOS)  Es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos.1 Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
  • 3. OBJETIVO DEL DATA MINING  El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y de gestión de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea
  • 4. FUNCIÓN  La tarea de minería de datos real es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación). Esto generalmente implica el uso de técnicas de bases de datos como los índices espaciales. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en la máquina de aprendizaje y análisis predictivo.
  • 5. PROCESO  Selección del conjunto de datos  Análisis de las propiedades de los datos  Transformación del conjunto de datos de entrada  Seleccionar y aplicar la técnica de minería de datos  Extracción de conocimiento  Interpretación y evaluación de datos
  • 6. Protocolo de un proyecto de minería de datos Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:  Comprensión: del negocio y del problema que se quiere resolver.  Determinación, obtención y limpieza: de los datos necesarios.  Creación de modelos matemáticos.  Validación, comunicación: de los resultados obtenidos.  Integración: si procede, de los resultados en un sistema transaccional o similar
  • 7. Técnicas de minería de datos Las técnicas más representativas son:  Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales.  Regresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.  Árboles de decisión.- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.  Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
  • 8.  Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes.  Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos. Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):  Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos.  Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.
  • 9. ¿PREGUNTAS?  ¿Qué es Data mining?  ¿Cuál es su función importante?  ¿Cuales son los tipos de técnica del Data mining que hay?