SlideShare una empresa de Scribd logo
DATA WAREHOUSE & DATA MINING http://www.espol.edu.ec
INTEGRANTES Bastidas Santos Washington Raúl López Serrano Silvio Stephan Montiel Salazar Marcos Xavier 
DATA WAREHOUSE
INTRODUCCIÓN DW es una tecnología construida para optimizar el uso y análisis de información utilizado por las organizaciones para adaptarse a los cambios en los mercados. Su función esencial es ser la base de un sistema de información gerencial. Debe cumplir el rol de integrador de información proveniente de fuentes funcionalmente distintas.
Se caracteriza por ser  integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza  DATA WAREHOUSE
DETALLES El DW   se encuentra normalmente implementado dentro de una arquitectura de cliente/servidor.  Por la complejidad de los DW es común utilizar  middleware  entre los clientes y los servidores dando una arquitectura de 3 niveles ( three tier ).
 
ARQUITECTURA Online Transaction Processing (OLTP) Consolidación Middleware Online Analytical Process (OLAP) Data Marts
OLTP Consultas rápidas, escuetas y predecibles Poco volumen de información e información disgregada Transacciones rápidas Gran nivel de concurrencia Modo de actualización on-line Baja redundancia de datos
Consolidación Se encarga de producir el cambio de los sistemas OLTP a las Bases de Datos OLAP. (comprobar validez, consistencia, actualización, propagación datos) Middleware Es un término genérico que se utiliza para referirse a todo tipo de software de conectividad que ofrece servicios u operaciones que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas
OLAP Estructura de datos transparente al usuario Solo Consulta, trabajan sobre la información operacional generada por los sistemas OLTP Consultas sobre grandes volúmenes de datos no predecibles Información histórica Modo de actualización Batch Alta redundancia de datos para facilitar la generación de consultas y obtener buenos tiempos de respuesta Poderoso Back-end analítico para múltiples aplicaciones de usuarios
TIPOS DE SISTEMAS OLAP ROLAP Motor relacional. Datos detallados, tablas normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve MOLAP Base de datos multidimensional. el resumen de la información es usualmente calculado por adelantado.  HOLAP (Hybrid OLAP ) Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional
DATA MARTS
DATA MARTS Es una versión especial de DW El Data Mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos. Es consultado mediante herramientas  OLAP  que ofrecen una visión multidimensional de la información.  Sobre estas bases de datos se pueden construir  EIS  y  DSS .  Data Mining: Proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil.
IMPLEMENTACIONES DE DW DW central:  un solo nivel con un solo almacén que soporta los requerimientos de información de toda la empresa. DW distribuido:  estructura de un solo nivel que se particiona para distribuirlo a nivel departamental. DW de dos niveles:  soporta requerimientos de información tanto a nivel empresarial como departamental.
Extract, Transform and Load (ETL)
EXTRACT, TRANSFORM AND LOAD (ETL) Extraer  los datos desde los sistemas de origen (Normalmente en DB relacionales). Debe causar un impacto mínimo. Transformación   aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Carga  los datos de la fase anterior en el sistema de destino. Se aplicarán todas las restricciones y triggers definidos.
ETL – PROCESAMIENTO PARALELO De datos:  dividir un único archivo secuencial en pequeños archivos de datos. De segmentación (pipeline):  Permitir el funcionamiento simultáneo de varios componentes en el mismo flujo de datos. De componente:  funcionamiento simultáneo de múltiples procesos en diferentes flujos de datos en el mismo puesto de trabajo.
ESQUEMA EN ESTRELLA Modelo de datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las dimensiones estas tiene una clave primaria  simple, mientras que en la tabla de hechos,  la clave principal estará compuesta por las claves principales de las demás.
ESQUEMA EN COPO DE NIEVE Un  esquema en copo de nieve  es una estructura algo más compleja que el esquema en estrella. Se da cuando alguna de las dimensiones se implementa con más de una tabla de datos. La finalidad es normalizar las tablas y así reducir el espacio de almacenamiento al eliminar la redundancia de datos
DATAWAREHOUSE – DATA MINING
DATA WAREHOUSE
EXECUTIVE INFORMATION SYSTEM (EIS) Herramienta orientada a usuarios de nivel gerencial. Permite a usuarios con perfil no técnico construir nuevos informes y navegar por los datos de la compañía para descubrir información relevante. Provee acceso instantáneo al estado de los indicadores de negocio que le afectan.
DECISION SUPPORT SYSTEM (DSS) Sistema informático utilizado para servir de apoyo, más que automatizar, el proceso de toma de decisiones, realizando análisis de las diferentes variables del negocio. Capacidad de análisis multidimensional (OLAP) que permite profundizar en la información hasta llegar a un alto nivel de detalle
 
 
DATA MINING
INTRODUCCION Proceso de extraer  conocimiento útil y comprensible, previamente desconocido  ( Witten y Frank, 2000 ) Que no es? Data warehousing SQL / Ad Hoc Queries / Reporting Software Agents Online Analytical Processing (OLAP) Data Visualization “ Rico en datos,  Pobre en información ” Conocimiento (patrones interesantes)
POR QUÉ MINERÍA DE DATOS? Gran cantidad de datos para analizar de forma clásica ¿Cómo explorar millones de registros, decenas o cientos de campos, y encontrar patrones? QUERY RESULT (Latitude, Longitude) 1 (Latitude, Longitude) 2
Knowledge Discovery in Databases Proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y en última instancia comprensibles a partir de los datos ”.  Fayyad et al. 1996
Computational Knowledge Discovery
QUÉ TIPOS DE DATOS ? Data Warehouses Base de Datos Transaccionales Sistemas de Base de Datos Avanzado: Objetos Relacionales Temporales y Espaciales Serie de Tiempo Multimedia, Texto WWW Structure - 3D Anatomy Function – 1D Signal Metadata – Annotation
MULTIPLES  DISCIPLINAS ? 20x20 ~ 2^400    10^120 patterns
CLASIFICACIÓN DE ALGORITMOS
CLASIFICACIÓN Encuentra modelos que describen y distinguen clases o conceptos. El objetivo es describir los datos o para hacer el futuro de predicción. Árbol de decisiones, la clasificación general, redes neuronales.
EJEMPLO CLASIFICACIÓN categoria categoria Continuo clase Test Set Training  Set Modelo Clasifica- dor
REPRESENTACIÓN :  ÁRBOL DE DECISIONES Refund MarSt TaxInc YES NO NO NO Yes No Married   Single, Divorced < 80K > 80K Atributos Divididos categoria categoria continuo clase
CLUSTERING Divide la información en diferentes grupos. A diferencia de la clasificación, no se sabe donde habrá clúster o con que atributos de los datos se harán los clústeres. Algoritmo K-means y  Mapas de Presentación de Kohonen  Clustering schemes Basado en Distancia ( Distancia entre vectores ) Basado en Partición (Enumera y valora) Basado en Modelo(
ALGORITMO K-MEANS Initial seeds
ALGORITMO K-MEANS Nuevos Centros
ALGORITMO K-MEANS Centros Finales
MODELO LÓGICO Mining Model Mining Model Training Data DB data Client data Application data Data Mining Engine To Predict Predicted Data Mining Model DB data Client data Application data “ Just one row ” Data Mining Engine algorithm
MODELO FÍSICO Analysis Services Server Mining Model Data Mining Algorithm Data Source Interfaz Gráfica OLE DB/ ADOMD/ XMLA App Data Resultado de la Evaulacion
MINERIA DE DATOS DISTRIBUIDA Hacer frente a plataformas heterogéneas, con múltiples bases de datos y (posiblemente) diferentes esquemas Diseñar e implementar protocolos escalables y eficaces para la comunicación con los datos de los sitios. Combine información recién adquiridos que previamente no estaban disponibles cuando los modelos se calcularon con los modelos existentes  La flexibilidad para incorporar nuevas técnicas de minería de datos

Más contenido relacionado

PPT
Probabilidad De Poison
PPTX
Modelo de redes
PPTX
Laboratorio 2
PDF
Varianza y covarianza
DOCX
Tarea 16 de probabilidad y estadistica con respuestas
 
PPT
Modelos de Simulacion
PPTX
Métodos de programación no lineal
PDF
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO
Probabilidad De Poison
Modelo de redes
Laboratorio 2
Varianza y covarianza
Tarea 16 de probabilidad y estadistica con respuestas
 
Modelos de Simulacion
Métodos de programación no lineal
KTN03-EL PROCESO DE CONSTRUCCIÓN DE MODELOS DE SISTEMAS DINÁMICO

La actualidad más candente (20)

PDF
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
PPTX
PPTX
Memoria Estatica
 
PPTX
Algoritmos de Dijkstra, Warshall, Ordenación Topológica.
DOCX
Introduccion a la estadistica
PPT
DISEÑO DE BASES DE DATOS DISTRIBUIDAS
PPT
Conceptos Fundamentales de Base de Datos
PPTX
Algebra relacional
PDF
Investigación de operaciones
DOCX
Recursividad
PPTX
Pruebas de hipótesis
PPTX
Valor esperado o media
DOCX
Optimizacion de redes
PPT
Presen Clases Bdd Unidad 3
DOC
Tipos de muestreo probabilìsticos.enero 2012.
PPTX
Maxíma verosimilitud
PPTX
ETAPAS DEL PROCESO DE SIMULACION
PPT
Modelos de programacion lineal y modelos dinamicos (2)
DOCX
Estadística Probabilidades
PPT
Distribucion geometrica
82253086 unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de...
Memoria Estatica
 
Algoritmos de Dijkstra, Warshall, Ordenación Topológica.
Introduccion a la estadistica
DISEÑO DE BASES DE DATOS DISTRIBUIDAS
Conceptos Fundamentales de Base de Datos
Algebra relacional
Investigación de operaciones
Recursividad
Pruebas de hipótesis
Valor esperado o media
Optimizacion de redes
Presen Clases Bdd Unidad 3
Tipos de muestreo probabilìsticos.enero 2012.
Maxíma verosimilitud
ETAPAS DEL PROCESO DE SIMULACION
Modelos de programacion lineal y modelos dinamicos (2)
Estadística Probabilidades
Distribucion geometrica
Publicidad

Destacado (20)

PPTX
Mineria de datos
PPTX
Minería de datos
PPT
Make Growth Happen for all Employees
PDF
Mineria de datos
PDF
Minería de datos
PPTX
Mineria de datos
PDF
Mapa conceptual mineria de datos 1
PDF
Minería de datos
PPTX
Minería de datos y kdd
PPT
Minería de datos en redes sociales
PPTX
Mineria de datos
PPTX
Mineria de datos
PPTX
Presentacion data mining (mineria de datos)- base de datos
PPTX
Diapositivas
PPT
Minería de datos Presentación
PPTX
Minería de datos
PPT
Mineria de Datos
PPT
MIneria de datos
PPT
Mineria De Datos
Mineria de datos
Minería de datos
Make Growth Happen for all Employees
Mineria de datos
Minería de datos
Mineria de datos
Mapa conceptual mineria de datos 1
Minería de datos
Minería de datos y kdd
Minería de datos en redes sociales
Mineria de datos
Mineria de datos
Presentacion data mining (mineria de datos)- base de datos
Diapositivas
Minería de datos Presentación
Minería de datos
Mineria de Datos
MIneria de datos
Mineria De Datos
Publicidad

Similar a mineria de datos (20)

PDF
Datawarehouse
PPT
Data Warehouse.gestion de bases de datos
PPTX
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
PPTX
Unidad vii esp parte 2 introduccion a data warehouse y datamining
PPTX
Unidad vii esp parte 2 introduccion a data warehouse y datamining
PPT
Unidad2 Bases De Datos Para L Toma De Desiciones
PPTX
Datawarehouse
PPTX
Data mart-data-warehouse-data-mining
PPTX
Seminario BI CLEFormación
PPT
Sistema De Informacion Gerencial
PPT
Sistema De Informacion Gerencial
PPT
Sistema De Informacion Gerencial
PPT
Sistema De Información Gerencial
PPT
Sistema de informacion gerencial
PPT
Sistema de informacion gerencial
PPT
Sistema de informacion gerencial
PPT
Copy of Charla Cibertec DAT.ppt
DOCX
Actividad #1 introducción a la inteligencia de negocios
PPTX
Introducción Bussines Intelligence
PPTX
Cap I - Componentes de Business Intelligence.pptx
Datawarehouse
Data Warehouse.gestion de bases de datos
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad2 Bases De Datos Para L Toma De Desiciones
Datawarehouse
Data mart-data-warehouse-data-mining
Seminario BI CLEFormación
Sistema De Informacion Gerencial
Sistema De Informacion Gerencial
Sistema De Informacion Gerencial
Sistema De Información Gerencial
Sistema de informacion gerencial
Sistema de informacion gerencial
Sistema de informacion gerencial
Copy of Charla Cibertec DAT.ppt
Actividad #1 introducción a la inteligencia de negocios
Introducción Bussines Intelligence
Cap I - Componentes de Business Intelligence.pptx

Más de Washington Bastidas (8)

PDF
Curso de GIS Básico
PDF
Curso de Python
PPTX
ArcGIS y Geoportal
PPTX
ArcGIS 10 - Actualización y Respaldo
PDF
Migracion Corporativa
PDF
Uso de Arcgis Explorer
PPT
Mercado de Valores
Curso de GIS Básico
Curso de Python
ArcGIS y Geoportal
ArcGIS 10 - Actualización y Respaldo
Migracion Corporativa
Uso de Arcgis Explorer
Mercado de Valores

Último (20)

PPTX
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PDF
Calidad desde el Docente y la mejora continua .pdf
PDF
taller de informática - LEY DE OHM
PDF
Maste clas de estructura metálica y arquitectura
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PDF
SAP Transportation Management para LSP, TM140 Col18
PDF
Plantilla para Diseño de Narrativas Transmedia.pdf
PPTX
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PDF
CyberOps Associate - Cisco Networking Academy
PPTX
Presentación PASANTIAS AuditorioOO..pptx
PPTX
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
DOCX
Zarate Quispe Alex aldayir aplicaciones de internet .docx
PPTX
Sesion 1 de microsoft power point - Clase 1
PPTX
Presentación de Redes de Datos modelo osi
PDF
Diapositiva proyecto de vida, materia catedra
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PDF
clase auditoria informatica 2025.........
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PDF
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
Calidad desde el Docente y la mejora continua .pdf
taller de informática - LEY DE OHM
Maste clas de estructura metálica y arquitectura
Power Point Nicolás Carrasco (disertación Roblox).pptx
SAP Transportation Management para LSP, TM140 Col18
Plantilla para Diseño de Narrativas Transmedia.pdf
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
CyberOps Associate - Cisco Networking Academy
Presentación PASANTIAS AuditorioOO..pptx
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
Zarate Quispe Alex aldayir aplicaciones de internet .docx
Sesion 1 de microsoft power point - Clase 1
Presentación de Redes de Datos modelo osi
Diapositiva proyecto de vida, materia catedra
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
clase auditoria informatica 2025.........
historia_web de la creacion de un navegador_presentacion.pptx
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...

mineria de datos

  • 1. DATA WAREHOUSE & DATA MINING http://www.espol.edu.ec
  • 2. INTEGRANTES Bastidas Santos Washington Raúl López Serrano Silvio Stephan Montiel Salazar Marcos Xavier 
  • 4. INTRODUCCIÓN DW es una tecnología construida para optimizar el uso y análisis de información utilizado por las organizaciones para adaptarse a los cambios en los mercados. Su función esencial es ser la base de un sistema de información gerencial. Debe cumplir el rol de integrador de información proveniente de fuentes funcionalmente distintas.
  • 5. Se caracteriza por ser integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza DATA WAREHOUSE
  • 6. DETALLES El DW se encuentra normalmente implementado dentro de una arquitectura de cliente/servidor. Por la complejidad de los DW es común utilizar middleware entre los clientes y los servidores dando una arquitectura de 3 niveles ( three tier ).
  • 7.  
  • 8. ARQUITECTURA Online Transaction Processing (OLTP) Consolidación Middleware Online Analytical Process (OLAP) Data Marts
  • 9. OLTP Consultas rápidas, escuetas y predecibles Poco volumen de información e información disgregada Transacciones rápidas Gran nivel de concurrencia Modo de actualización on-line Baja redundancia de datos
  • 10. Consolidación Se encarga de producir el cambio de los sistemas OLTP a las Bases de Datos OLAP. (comprobar validez, consistencia, actualización, propagación datos) Middleware Es un término genérico que se utiliza para referirse a todo tipo de software de conectividad que ofrece servicios u operaciones que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas
  • 11. OLAP Estructura de datos transparente al usuario Solo Consulta, trabajan sobre la información operacional generada por los sistemas OLTP Consultas sobre grandes volúmenes de datos no predecibles Información histórica Modo de actualización Batch Alta redundancia de datos para facilitar la generación de consultas y obtener buenos tiempos de respuesta Poderoso Back-end analítico para múltiples aplicaciones de usuarios
  • 12. TIPOS DE SISTEMAS OLAP ROLAP Motor relacional. Datos detallados, tablas normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve MOLAP Base de datos multidimensional. el resumen de la información es usualmente calculado por adelantado. HOLAP (Hybrid OLAP ) Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional
  • 14. DATA MARTS Es una versión especial de DW El Data Mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos. Es consultado mediante herramientas OLAP que ofrecen una visión multidimensional de la información. Sobre estas bases de datos se pueden construir EIS y DSS . Data Mining: Proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil.
  • 15. IMPLEMENTACIONES DE DW DW central: un solo nivel con un solo almacén que soporta los requerimientos de información de toda la empresa. DW distribuido: estructura de un solo nivel que se particiona para distribuirlo a nivel departamental. DW de dos niveles: soporta requerimientos de información tanto a nivel empresarial como departamental.
  • 17. EXTRACT, TRANSFORM AND LOAD (ETL) Extraer los datos desde los sistemas de origen (Normalmente en DB relacionales). Debe causar un impacto mínimo. Transformación aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Carga los datos de la fase anterior en el sistema de destino. Se aplicarán todas las restricciones y triggers definidos.
  • 18. ETL – PROCESAMIENTO PARALELO De datos: dividir un único archivo secuencial en pequeños archivos de datos. De segmentación (pipeline): Permitir el funcionamiento simultáneo de varios componentes en el mismo flujo de datos. De componente: funcionamiento simultáneo de múltiples procesos en diferentes flujos de datos en el mismo puesto de trabajo.
  • 19. ESQUEMA EN ESTRELLA Modelo de datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las dimensiones estas tiene una clave primaria simple, mientras que en la tabla de hechos, la clave principal estará compuesta por las claves principales de las demás.
  • 20. ESQUEMA EN COPO DE NIEVE Un esquema en copo de nieve es una estructura algo más compleja que el esquema en estrella. Se da cuando alguna de las dimensiones se implementa con más de una tabla de datos. La finalidad es normalizar las tablas y así reducir el espacio de almacenamiento al eliminar la redundancia de datos
  • 23. EXECUTIVE INFORMATION SYSTEM (EIS) Herramienta orientada a usuarios de nivel gerencial. Permite a usuarios con perfil no técnico construir nuevos informes y navegar por los datos de la compañía para descubrir información relevante. Provee acceso instantáneo al estado de los indicadores de negocio que le afectan.
  • 24. DECISION SUPPORT SYSTEM (DSS) Sistema informático utilizado para servir de apoyo, más que automatizar, el proceso de toma de decisiones, realizando análisis de las diferentes variables del negocio. Capacidad de análisis multidimensional (OLAP) que permite profundizar en la información hasta llegar a un alto nivel de detalle
  • 25.  
  • 26.  
  • 28. INTRODUCCION Proceso de extraer conocimiento útil y comprensible, previamente desconocido ( Witten y Frank, 2000 ) Que no es? Data warehousing SQL / Ad Hoc Queries / Reporting Software Agents Online Analytical Processing (OLAP) Data Visualization “ Rico en datos, Pobre en información ” Conocimiento (patrones interesantes)
  • 29. POR QUÉ MINERÍA DE DATOS? Gran cantidad de datos para analizar de forma clásica ¿Cómo explorar millones de registros, decenas o cientos de campos, y encontrar patrones? QUERY RESULT (Latitude, Longitude) 1 (Latitude, Longitude) 2
  • 30. Knowledge Discovery in Databases Proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y en última instancia comprensibles a partir de los datos ”. Fayyad et al. 1996
  • 32. QUÉ TIPOS DE DATOS ? Data Warehouses Base de Datos Transaccionales Sistemas de Base de Datos Avanzado: Objetos Relacionales Temporales y Espaciales Serie de Tiempo Multimedia, Texto WWW Structure - 3D Anatomy Function – 1D Signal Metadata – Annotation
  • 33. MULTIPLES DISCIPLINAS ? 20x20 ~ 2^400  10^120 patterns
  • 35. CLASIFICACIÓN Encuentra modelos que describen y distinguen clases o conceptos. El objetivo es describir los datos o para hacer el futuro de predicción. Árbol de decisiones, la clasificación general, redes neuronales.
  • 36. EJEMPLO CLASIFICACIÓN categoria categoria Continuo clase Test Set Training Set Modelo Clasifica- dor
  • 37. REPRESENTACIÓN : ÁRBOL DE DECISIONES Refund MarSt TaxInc YES NO NO NO Yes No Married Single, Divorced < 80K > 80K Atributos Divididos categoria categoria continuo clase
  • 38. CLUSTERING Divide la información en diferentes grupos. A diferencia de la clasificación, no se sabe donde habrá clúster o con que atributos de los datos se harán los clústeres. Algoritmo K-means y Mapas de Presentación de Kohonen Clustering schemes Basado en Distancia ( Distancia entre vectores ) Basado en Partición (Enumera y valora) Basado en Modelo(
  • 42. MODELO LÓGICO Mining Model Mining Model Training Data DB data Client data Application data Data Mining Engine To Predict Predicted Data Mining Model DB data Client data Application data “ Just one row ” Data Mining Engine algorithm
  • 43. MODELO FÍSICO Analysis Services Server Mining Model Data Mining Algorithm Data Source Interfaz Gráfica OLE DB/ ADOMD/ XMLA App Data Resultado de la Evaulacion
  • 44. MINERIA DE DATOS DISTRIBUIDA Hacer frente a plataformas heterogéneas, con múltiples bases de datos y (posiblemente) diferentes esquemas Diseñar e implementar protocolos escalables y eficaces para la comunicación con los datos de los sitios. Combine información recién adquiridos que previamente no estaban disponibles cuando los modelos se calcularon con los modelos existentes La flexibilidad para incorporar nuevas técnicas de minería de datos