SlideShare una empresa de Scribd logo
Inteligencia de negocios Introducción a Business Intelligence
INTELIGENCIA DE NEGOCIOS ¿Qué es la Inteligencia de Negocios?
¿Qué es la Inteligencia de Negocios? La  Inteligencia de Negocio (IN) o Business Intelligence (BI)  es el conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
Objetivos de la Inteligencia de Negocios Accesibilidad a la información  Las herramientas y técnicas  de BI permiten a los usuarios un acceso a los datos apropiado.  Apoyo en la toma de decisiones  Los usuarios tienen acceso a herramientas de análisis y de presentación de la información que facilitan la importante tarea de decidir ciertas situaciones. Orientación al usuario final  Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.
Ventajas que aporta la Inteligencia de Negocios en su empresa. Controlar los gastos de TI Posee un único entorno para administrar. Mejorar la colaboración y la calidad de las decisiones La información  queda a disposición del personal de la empresa en todos los niveles. Reducir el número de sesiones de aprendizaje para los empleados Interfaz sencilla e intuitiva. Proporcionar al personal una visión detallada de las operaciones empresariales  Posee un conjunto de aplicaciones analíticas, cálculos, escritorios digitales, informes, análisis, minería de almacenamiento de datos y otras tecnologías. Asistir a los directivos en la organización y previsión del trabajo Proporciona una visión general única y común de todos los procesos empresariales en los distintos departamentos.
Herramientas para la Inteligencia de Negocios
Conceptos básicos Business Intelligence UDM (Modelo unidimensional unificado) Estandarización de los orígenes de datos. Almacén de datos Colección de orígenes de datos orientados a la ayuda de toma de decisiones empresariales. Cubo Un cubo OLAP es una vista lógica de los datos y representan un conjunto de datos relacionados con un tema en particular como Ventas, Operaciones, Recursos Humanos, etc., y están a disposición de los "clientes" a quienes les pueden interesar. Dimensión Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios. Descripciones, Nombres, Zonas, Rangos de tiempo, etc. Medidas Aspectos cuantificables o medibles de los objetos o eventos a analizar. Importes ventas, recuento empleados, etc.
Almacén de datos frente a ERP o base de datos convencional. Los orígenes de datos están diseñados por  desarrolladores . Un almacén de datos tiene la finalidad de facilitar la comprensión de  usuarios finales .  La información interesante para el usuario se distribuye generalmente en  varios orígenes de datos heterogéneos .  En almacenes de datos se pueden unificar. Aunque muchos orígenes de datos están concebidos para contener una gran cantidad de detalles de los niveles de transacción, con frecuencia  las consultas necesarias para tomar las decisiones corporativas precisan información agregada y de resumen . Al aumentar el volumen de datos, el tiempo necesario para recuperar los valores de resumen para un análisis de un usuario final interactivo es a menudo prohibitivo.  Por lo general, las reglas de negocios no están encapsuladas en los orígenes de datos. Los usuarios deben realizar su propia  interpretación de los datos .
Almacén de datos Es posible un  análisis de datos  en cualquier base de datos o ERP, con cubos, informes, etc.  El objetivo de un almacén de datos es preparar la información existente en la base de datos o ERP, para el análisis y toma de decisiones.  Un almacén de datos se prepara para admitir: Procesamiento analítico en línea  Minería de datos
Elementos de un almacén de datos Tablas de hecho Tablas de dimensión
Tablas de hecho Las  tablas de hecho  son colecciones de tablas que contienen columnas para cada expresión medible.  Almacenan sucesos medibles: Transacciones de Ventas,  Compras  Balances de inventarios, y otros hechos  (ingresos en la clínica, importes, etc.)
Tablas de dimensión Las tablas de dimensiones almacenan los valores que se utilizan en las tablas de hechos.  Almacenan información de  Clientes Proveedores Empleados Geográfica Tiempos
Dimensión de Tiempo. La dimensión de tiempo permite a los usuarios  resumir información de las tablas de hecho en períodos de tiempo .  Permite conocer: Totales de calendarios anuales,  Comparar  porcentajes respectos de periodos fiscales anteriores, Conocer información en calendarios de fabricación. Organizar la información según jerarquías de tiempo específicas. Sus atributos son  horas ,  semestres ,  trimestres ,  meses  y  días.  Las jerarquías permiten analizar los datos con mayor granularidad, por ejemplo, año – semestre – trimestres – meses.
Microsoft SQL  Server ( Motor de base de datos) Entornos que proporciona Microsoft SQL  Server para trabajar con almacén de datos: SQL Server Management Studio.  Administrar y configurar objetos existentes en Almacén de datos. (Definición de tablas de dimensión y tablas de hecho, índices, restricciones, usuarios, inicios de sesión, etc.)
Estructura del almacén de datos
Microsoft SQL  Server Análysis Services (SSAS) Entornos que proporciona Microsoft SQL  Server para trabajar con SSAS: SQL Server Management Studio.  Administrar y configurar objetos existentes Analysis Services. (Acceso de usuarios a datos de clínica)  Business Intelligence Development Studio.  Desarrollar soluciones de Business Intelligence que incluyen funciones de Analysis Services, Integration Services y Reporting Services.  (Realizar consultas sobre enfermedades, tiempo, etc)
Elementos de Analysis Services Orígenes  de datos Vistas de orígenes de datos Cubos Dimensiones Estructuras de minería  Funciones  Ensamblados
Origen de datos Es una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que  Analysis Services  conectará con un almacén de datos físico mediante un proveedor Microsoft .NET Framework o un proveedor OLE DB nativo. (Tenemos que conectarnos a los datos que nos proporciona en el almacén de datos)
Vista de origen de datos Es la definición de los metadatos (información de los datos). Contiene el modelo lógico del esquema que utilizan los objetos de bases de datos: cubos, dimensiones y estructuras de minería de datos. (DimEnfermedades, DimEspecialidad, DimMedicos, DimPacientes, Tablahecho, cubo, etc )
Cubos Es un conjunto de medidas (hechos) y dimensiones (áreas de interés tales como tiempo, producto y cliente).  Las consultas que realizaremos en los datos Filas y columnas: enfermedades por trimestre Área de datos: Número pacientes
Dimensiones Las dimensiones organizan los datos en función de un área de interés para los usuarios: Clientes, almacenes o empleados. Contienen  atributos  que corresponden a las columnas de las tablas de dimensiones.  Los atributos se pueden organizar en estructuras jerárquicas o jerarquías.
Inteligencia de negocios Data Mining
Minería de Datos La minería de datos trabaja con los datos con el objetivo de encontrar patrones de comportamiento ocultos en los mismos con el fin de crear nuevas asociaciones, predecir resultados futuros, etc. Las organizaciones se han convertido en entidades sumamente ricas en datos pero pobre en conocimiento. De modo que el objetivo principal de la minería de datos es generar patrones de comportamiento en los datos y a partir de ellos generar conocimiento útil.
Importancia de la Minería de Datos Disponemos de una cantidad inmensa de datos en nuestra organizaciones: Gracias a los programas de gestión empresarial, y al descenso del hardware, especialmente de los sistemas de almacenamiento ha llevado a las empresas a disponer de bases de datos con gigas de datos. Incremento de la competitividad. El incremento de la competitividad es en gran medida resultado de marketing actual, de los nuevos canales de distribución que dispone como Internet y de las telecomunicaciones y la aplicación de las TIC a la actividad empresarial. Las empresas se enfrentan a una economía globalizada, y el éxito empresarial depende de la capacidad de mantener a los clientes actuales y conseguir nuevos. La minería de datos contiene tecnologías que permiten a las empresas analizar los factures que influyen decisivamente en estos temas.
Ciclo de un Proyecto de Minería de Datos PASO 1. RECOLECCIÓN DE DATOS El primer paso en un proyecto de minería de datos es la recolección de datos. Los datos de una organización habitualmente están almacenados en muchos sitios: base de datos de un ERP, de un CRM, hojas de cálculo de los comerciales y/o de los contables, una pequeña aplicación para controlar el stock en el almacén, etc. Por este motivo, la primera tarea que debemos emprender es determinar cuáles son los datos más relevantes y almacenarlos de modo adecuado en un almacén de datos o datawarehouse
Ciclo de un Proyecto de Minería de Datos PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS Este es el paso más importante en un proyecto de minería de datos. La depuración y  transformación de los datos tiene como objetivo eliminar el ruido y la información irrelevante. El proceso de transformación consiste en modificar los datos originales en diferentes formatos en términos de tipos de datos y valores.
Ciclo de un Proyecto de Minería de Datos PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS Técnicas. Transformación tipos de datos. Convertir valores continuos en discretos. Suprimir casos atípicos. Eliminar aquellos datos que pueden falsear los datos, por ejemplo, un cliente que haga un pedido excepcional que supera en 10 veces el importe habitual. Utilizando el modelo de clustering incluido en Microsoft SQL 2005 podemos generar un modelo que agrupe los casos atípicos para posteriormente eliminarlos a través de la combinación de Data Mining e Integration Services.
Ciclo de un Proyecto de Minería de Datos PASO 3. GENEAR EL MODELO DE MINERIA DE DATOS. Una vez que hemos limpiado y transformado los datos, podemos comenzar la tarea de crear los modelos de minería de datos. Antes de generar cualquier tipo de modelo, es fundamental entender cuál es la meta del proyecto de minería de datos. ¿Vamos a crear un proyecto para clasificar, para generar una asociación, para establecer una segmentación, o para pronosticar y planificar las ventas del próximo año? El modelo es el corazón de cualquier proyecto de minería de datos. No obstante, una vez que uno tiene claro cual es el objetivo del proyecto, seleccionar el algoritmo que genere el modelo es una tarea relativamente sencilla.
Ciclo de un Proyecto de Minería de Datos PASO 4. EVALUACIÓN DEL MODELO Existen unas pocas herramientas para evaluar la calidad de un modelo de minería de datos. La más conocida es el  gráfico de rendimiento  Esta herramienta utiliza los datos de un modelo entrenado para predecir los valores de una conjunto de datos de evaluación. No sólo se evalúa la precisión del modelo sino que se trata de comprender el significado de los patrones de comportamiento que los algoritmos han generado. En ocasiones, los patrones hallados no contienen información útil. Esto se pude deber a diferentes factores: a) los datos utilizados son totalmente aleatorios; b) que las variables utilizadas en el modelo no son las más precisas; c) la limpieza de datos no ha sido suficiente, y se ha de volver a la fase anterior.
Ciclo de un Proyecto de Minería de Datos PASO 5. REPORTING Reporting es una de las tareas claves en la minería de datos. En muchas organizaciones, la meta final de la minería de datos es generar informes para los responsables de los diferentes departamentos.
Ciclo de un Proyecto de Minería de Datos PASO 6. PREDICCIÓN Muchos de los proyectos de minería de datos, la búsqueda de patrones ocultos entre los datos responde a la necesidad de generar predicciones, por ejemplo de las ventas del próximo trimestre. La predicción se convierte por tanto en una de las tareas claves de la minería de datos.

Más contenido relacionado

PDF
Minería de datos
PPTX
Presentacion data mining (mineria de datos)- base de datos
PPTX
Algebra relacional
PPTX
Normalización de la base de datos (3 formas normales)
DOCX
Mineria de datos
PDF
1. Modelo de Datos
Minería de datos
Presentacion data mining (mineria de datos)- base de datos
Algebra relacional
Normalización de la base de datos (3 formas normales)
Mineria de datos
1. Modelo de Datos

La actualidad más candente (20)

PPTX
Mineria de datos secuenciales
PDF
P. estructurada vs. programación orientada a objetos
PDF
Bigdata trabajo de investigacion
PPTX
Bases de datos jerarquicas
PPT
modelo entidad-relacion
PPT
Mineria De Datos
PPTX
Estructura de Datos - Unidad 6 Metodos de busqueda
PPTX
Big Data: conceptos generales e impacto en los negocios
DOC
TRABAJO BUSINESS INTELLIGENCE
PPTX
Modelo relacional
PPTX
Proyecciones estadísticas final
PPT
Diseño de bases de datos
PDF
Introducción a la Ciencia de Datos
PPTX
Unidad 1. Sistema Manejador de Bases de Datos
PPT
Mineria de Datos
PPTX
Caracteristicas de las bases de datos
PDF
Introducción a Ciencia de datos con Microsoft
PPTX
Data mart
PDF
Requisitos funcionales y no funcionales
PPT
Sistemas de Gestión de Bases de datos
Mineria de datos secuenciales
P. estructurada vs. programación orientada a objetos
Bigdata trabajo de investigacion
Bases de datos jerarquicas
modelo entidad-relacion
Mineria De Datos
Estructura de Datos - Unidad 6 Metodos de busqueda
Big Data: conceptos generales e impacto en los negocios
TRABAJO BUSINESS INTELLIGENCE
Modelo relacional
Proyecciones estadísticas final
Diseño de bases de datos
Introducción a la Ciencia de Datos
Unidad 1. Sistema Manejador de Bases de Datos
Mineria de Datos
Caracteristicas de las bases de datos
Introducción a Ciencia de datos con Microsoft
Data mart
Requisitos funcionales y no funcionales
Sistemas de Gestión de Bases de datos
Publicidad

Destacado (20)

PPTX
Minería de datos
PDF
Aplicaciones de la mineria de datos
PPTX
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
PPTX
Data Mining
PPT
¿Qué es un modelo predictivo y para qué vale?
PDF
Modelos predictivos: datos, métodos, problemas y aplicaciones
PPT
Make Growth Happen for all Employees
PPT
Minería de datos en redes sociales
PPTX
Minería de datos y kdd
PPTX
Mineria de datos
PPTX
Mineria de datos
PDF
Minería de datos
PDF
Mapa conceptual mineria de datos 1
PPTX
Mineria de datos
PPT
mineria de datos
PPTX
Minería de datos
PPTX
Mineria de datos
PDF
Mineria de datos
PPTX
Diapositivas
PPT
MIneria de datos
Minería de datos
Aplicaciones de la mineria de datos
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Data Mining
¿Qué es un modelo predictivo y para qué vale?
Modelos predictivos: datos, métodos, problemas y aplicaciones
Make Growth Happen for all Employees
Minería de datos en redes sociales
Minería de datos y kdd
Mineria de datos
Mineria de datos
Minería de datos
Mapa conceptual mineria de datos 1
Mineria de datos
mineria de datos
Minería de datos
Mineria de datos
Mineria de datos
Diapositivas
MIneria de datos
Publicidad

Similar a Minería de datos Presentación (20)

PPTX
Inteligencia de negocios
PPTX
SIG 2021-P U3- Gestion Conocimiento.pptx
PPTX
Presentación Sistemas
PPTX
Unidad vii esp parte 2 introduccion a data warehouse y datamining
PPTX
Unidad vii esp parte 2 introduccion a data warehouse y datamining
DOCX
Traduccion data warehousing
PPT
Unidad2 Bases De Datos Para L Toma De Desiciones
PPTX
Bussines Intelligence
PPT
Copy of Charla Cibertec DAT.ppt
PPTX
Almacenes, mineria y análisis de datos
DOCX
Actividad #1 introducción a la inteligencia de negocios
PDF
PDF
Caso de usos mineria
DOCX
Inteligencia de negocios
DOCX
Inteligencia de negocios
DOCX
Inteligencia de negocios
DOCX
Inteligencia de negocios
PPTX
PPTX
Business Intelligence
PDF
Dts y analysis services 2000
Inteligencia de negocios
SIG 2021-P U3- Gestion Conocimiento.pptx
Presentación Sistemas
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Traduccion data warehousing
Unidad2 Bases De Datos Para L Toma De Desiciones
Bussines Intelligence
Copy of Charla Cibertec DAT.ppt
Almacenes, mineria y análisis de datos
Actividad #1 introducción a la inteligencia de negocios
Caso de usos mineria
Inteligencia de negocios
Inteligencia de negocios
Inteligencia de negocios
Inteligencia de negocios
Business Intelligence
Dts y analysis services 2000

Último (20)

PPTX
El uso de las TIC en la vida cotidiana..
PPTX
Historia Inteligencia Artificial Ana Romero.pptx
PPTX
Diapositivas Borrador Rocha Jauregui David Paolo (3).pptx
PPTX
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
PPTX
Tema 1 Taller de tecnologia y proceso tecnologico.pptx
PDF
Documental Beyond the Code (Dossier Presentación - 2.0)
PDF
Distribucion de frecuencia exel (1).pdf
PPTX
modulo seguimiento 1 para iniciantes del
PDF
capacitación de aire acondicionado Bgh r 410
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PDF
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
DOCX
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
PDF
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
DOCX
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
PDF
Teoría de estadística descriptiva y aplicaciones .pdf
PDF
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PPTX
ccna: redes de nat ipv4 stharlling cande
PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
Control de calidad en productos de frutas
El uso de las TIC en la vida cotidiana..
Historia Inteligencia Artificial Ana Romero.pptx
Diapositivas Borrador Rocha Jauregui David Paolo (3).pptx
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
Tema 1 Taller de tecnologia y proceso tecnologico.pptx
Documental Beyond the Code (Dossier Presentación - 2.0)
Distribucion de frecuencia exel (1).pdf
modulo seguimiento 1 para iniciantes del
capacitación de aire acondicionado Bgh r 410
Estrategia de Apoyo de Daylin Castaño (5).pdf
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
Teoría de estadística descriptiva y aplicaciones .pdf
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
TRABAJO DE TECNOLOGIA.pdf...........................
ccna: redes de nat ipv4 stharlling cande
Propuesta BKP servidores con Acronis1.pptx
Control de calidad en productos de frutas

Minería de datos Presentación

  • 1. Inteligencia de negocios Introducción a Business Intelligence
  • 2. INTELIGENCIA DE NEGOCIOS ¿Qué es la Inteligencia de Negocios?
  • 3. ¿Qué es la Inteligencia de Negocios? La Inteligencia de Negocio (IN) o Business Intelligence (BI) es el conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
  • 4. Objetivos de la Inteligencia de Negocios Accesibilidad a la información Las herramientas y técnicas de BI permiten a los usuarios un acceso a los datos apropiado. Apoyo en la toma de decisiones Los usuarios tienen acceso a herramientas de análisis y de presentación de la información que facilitan la importante tarea de decidir ciertas situaciones. Orientación al usuario final Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.
  • 5. Ventajas que aporta la Inteligencia de Negocios en su empresa. Controlar los gastos de TI Posee un único entorno para administrar. Mejorar la colaboración y la calidad de las decisiones La información queda a disposición del personal de la empresa en todos los niveles. Reducir el número de sesiones de aprendizaje para los empleados Interfaz sencilla e intuitiva. Proporcionar al personal una visión detallada de las operaciones empresariales Posee un conjunto de aplicaciones analíticas, cálculos, escritorios digitales, informes, análisis, minería de almacenamiento de datos y otras tecnologías. Asistir a los directivos en la organización y previsión del trabajo Proporciona una visión general única y común de todos los procesos empresariales en los distintos departamentos.
  • 6. Herramientas para la Inteligencia de Negocios
  • 7. Conceptos básicos Business Intelligence UDM (Modelo unidimensional unificado) Estandarización de los orígenes de datos. Almacén de datos Colección de orígenes de datos orientados a la ayuda de toma de decisiones empresariales. Cubo Un cubo OLAP es una vista lógica de los datos y representan un conjunto de datos relacionados con un tema en particular como Ventas, Operaciones, Recursos Humanos, etc., y están a disposición de los "clientes" a quienes les pueden interesar. Dimensión Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios. Descripciones, Nombres, Zonas, Rangos de tiempo, etc. Medidas Aspectos cuantificables o medibles de los objetos o eventos a analizar. Importes ventas, recuento empleados, etc.
  • 8. Almacén de datos frente a ERP o base de datos convencional. Los orígenes de datos están diseñados por desarrolladores . Un almacén de datos tiene la finalidad de facilitar la comprensión de usuarios finales . La información interesante para el usuario se distribuye generalmente en varios orígenes de datos heterogéneos . En almacenes de datos se pueden unificar. Aunque muchos orígenes de datos están concebidos para contener una gran cantidad de detalles de los niveles de transacción, con frecuencia las consultas necesarias para tomar las decisiones corporativas precisan información agregada y de resumen . Al aumentar el volumen de datos, el tiempo necesario para recuperar los valores de resumen para un análisis de un usuario final interactivo es a menudo prohibitivo. Por lo general, las reglas de negocios no están encapsuladas en los orígenes de datos. Los usuarios deben realizar su propia interpretación de los datos .
  • 9. Almacén de datos Es posible un análisis de datos en cualquier base de datos o ERP, con cubos, informes, etc. El objetivo de un almacén de datos es preparar la información existente en la base de datos o ERP, para el análisis y toma de decisiones. Un almacén de datos se prepara para admitir: Procesamiento analítico en línea Minería de datos
  • 10. Elementos de un almacén de datos Tablas de hecho Tablas de dimensión
  • 11. Tablas de hecho Las tablas de hecho son colecciones de tablas que contienen columnas para cada expresión medible. Almacenan sucesos medibles: Transacciones de Ventas, Compras Balances de inventarios, y otros hechos (ingresos en la clínica, importes, etc.)
  • 12. Tablas de dimensión Las tablas de dimensiones almacenan los valores que se utilizan en las tablas de hechos. Almacenan información de Clientes Proveedores Empleados Geográfica Tiempos
  • 13. Dimensión de Tiempo. La dimensión de tiempo permite a los usuarios resumir información de las tablas de hecho en períodos de tiempo . Permite conocer: Totales de calendarios anuales, Comparar porcentajes respectos de periodos fiscales anteriores, Conocer información en calendarios de fabricación. Organizar la información según jerarquías de tiempo específicas. Sus atributos son horas , semestres , trimestres , meses y días. Las jerarquías permiten analizar los datos con mayor granularidad, por ejemplo, año – semestre – trimestres – meses.
  • 14. Microsoft SQL Server ( Motor de base de datos) Entornos que proporciona Microsoft SQL Server para trabajar con almacén de datos: SQL Server Management Studio. Administrar y configurar objetos existentes en Almacén de datos. (Definición de tablas de dimensión y tablas de hecho, índices, restricciones, usuarios, inicios de sesión, etc.)
  • 16. Microsoft SQL Server Análysis Services (SSAS) Entornos que proporciona Microsoft SQL Server para trabajar con SSAS: SQL Server Management Studio. Administrar y configurar objetos existentes Analysis Services. (Acceso de usuarios a datos de clínica) Business Intelligence Development Studio. Desarrollar soluciones de Business Intelligence que incluyen funciones de Analysis Services, Integration Services y Reporting Services. (Realizar consultas sobre enfermedades, tiempo, etc)
  • 17. Elementos de Analysis Services Orígenes de datos Vistas de orígenes de datos Cubos Dimensiones Estructuras de minería Funciones Ensamblados
  • 18. Origen de datos Es una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que Analysis Services conectará con un almacén de datos físico mediante un proveedor Microsoft .NET Framework o un proveedor OLE DB nativo. (Tenemos que conectarnos a los datos que nos proporciona en el almacén de datos)
  • 19. Vista de origen de datos Es la definición de los metadatos (información de los datos). Contiene el modelo lógico del esquema que utilizan los objetos de bases de datos: cubos, dimensiones y estructuras de minería de datos. (DimEnfermedades, DimEspecialidad, DimMedicos, DimPacientes, Tablahecho, cubo, etc )
  • 20. Cubos Es un conjunto de medidas (hechos) y dimensiones (áreas de interés tales como tiempo, producto y cliente). Las consultas que realizaremos en los datos Filas y columnas: enfermedades por trimestre Área de datos: Número pacientes
  • 21. Dimensiones Las dimensiones organizan los datos en función de un área de interés para los usuarios: Clientes, almacenes o empleados. Contienen atributos que corresponden a las columnas de las tablas de dimensiones. Los atributos se pueden organizar en estructuras jerárquicas o jerarquías.
  • 23. Minería de Datos La minería de datos trabaja con los datos con el objetivo de encontrar patrones de comportamiento ocultos en los mismos con el fin de crear nuevas asociaciones, predecir resultados futuros, etc. Las organizaciones se han convertido en entidades sumamente ricas en datos pero pobre en conocimiento. De modo que el objetivo principal de la minería de datos es generar patrones de comportamiento en los datos y a partir de ellos generar conocimiento útil.
  • 24. Importancia de la Minería de Datos Disponemos de una cantidad inmensa de datos en nuestra organizaciones: Gracias a los programas de gestión empresarial, y al descenso del hardware, especialmente de los sistemas de almacenamiento ha llevado a las empresas a disponer de bases de datos con gigas de datos. Incremento de la competitividad. El incremento de la competitividad es en gran medida resultado de marketing actual, de los nuevos canales de distribución que dispone como Internet y de las telecomunicaciones y la aplicación de las TIC a la actividad empresarial. Las empresas se enfrentan a una economía globalizada, y el éxito empresarial depende de la capacidad de mantener a los clientes actuales y conseguir nuevos. La minería de datos contiene tecnologías que permiten a las empresas analizar los factures que influyen decisivamente en estos temas.
  • 25. Ciclo de un Proyecto de Minería de Datos PASO 1. RECOLECCIÓN DE DATOS El primer paso en un proyecto de minería de datos es la recolección de datos. Los datos de una organización habitualmente están almacenados en muchos sitios: base de datos de un ERP, de un CRM, hojas de cálculo de los comerciales y/o de los contables, una pequeña aplicación para controlar el stock en el almacén, etc. Por este motivo, la primera tarea que debemos emprender es determinar cuáles son los datos más relevantes y almacenarlos de modo adecuado en un almacén de datos o datawarehouse
  • 26. Ciclo de un Proyecto de Minería de Datos PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS Este es el paso más importante en un proyecto de minería de datos. La depuración y transformación de los datos tiene como objetivo eliminar el ruido y la información irrelevante. El proceso de transformación consiste en modificar los datos originales en diferentes formatos en términos de tipos de datos y valores.
  • 27. Ciclo de un Proyecto de Minería de Datos PASO 2. DEPURACIÓN Y TRANSFORMCIÓN DE LOS DATOS Técnicas. Transformación tipos de datos. Convertir valores continuos en discretos. Suprimir casos atípicos. Eliminar aquellos datos que pueden falsear los datos, por ejemplo, un cliente que haga un pedido excepcional que supera en 10 veces el importe habitual. Utilizando el modelo de clustering incluido en Microsoft SQL 2005 podemos generar un modelo que agrupe los casos atípicos para posteriormente eliminarlos a través de la combinación de Data Mining e Integration Services.
  • 28. Ciclo de un Proyecto de Minería de Datos PASO 3. GENEAR EL MODELO DE MINERIA DE DATOS. Una vez que hemos limpiado y transformado los datos, podemos comenzar la tarea de crear los modelos de minería de datos. Antes de generar cualquier tipo de modelo, es fundamental entender cuál es la meta del proyecto de minería de datos. ¿Vamos a crear un proyecto para clasificar, para generar una asociación, para establecer una segmentación, o para pronosticar y planificar las ventas del próximo año? El modelo es el corazón de cualquier proyecto de minería de datos. No obstante, una vez que uno tiene claro cual es el objetivo del proyecto, seleccionar el algoritmo que genere el modelo es una tarea relativamente sencilla.
  • 29. Ciclo de un Proyecto de Minería de Datos PASO 4. EVALUACIÓN DEL MODELO Existen unas pocas herramientas para evaluar la calidad de un modelo de minería de datos. La más conocida es el gráfico de rendimiento Esta herramienta utiliza los datos de un modelo entrenado para predecir los valores de una conjunto de datos de evaluación. No sólo se evalúa la precisión del modelo sino que se trata de comprender el significado de los patrones de comportamiento que los algoritmos han generado. En ocasiones, los patrones hallados no contienen información útil. Esto se pude deber a diferentes factores: a) los datos utilizados son totalmente aleatorios; b) que las variables utilizadas en el modelo no son las más precisas; c) la limpieza de datos no ha sido suficiente, y se ha de volver a la fase anterior.
  • 30. Ciclo de un Proyecto de Minería de Datos PASO 5. REPORTING Reporting es una de las tareas claves en la minería de datos. En muchas organizaciones, la meta final de la minería de datos es generar informes para los responsables de los diferentes departamentos.
  • 31. Ciclo de un Proyecto de Minería de Datos PASO 6. PREDICCIÓN Muchos de los proyectos de minería de datos, la búsqueda de patrones ocultos entre los datos responde a la necesidad de generar predicciones, por ejemplo de las ventas del próximo trimestre. La predicción se convierte por tanto en una de las tareas claves de la minería de datos.