SlideShare una empresa de Scribd logo
INTRODUCCION AL DATA WAREHOUSE
Un data warehouse es un repositorio unificado para
todos los datos que recogen los diversos sistemas de
una empresa. El repositorio puede ser físico o lógico
y hace hincapié en la captura de datos de diversas
fuentes sobre todo para fines analíticos y de acceso.
Normalmente, un data warehouse se aloja en un
servidor corporativo o en la nube. Los datos de
diferentes aplicaciones de procesamiento de
transacciones Online (OLTP) y otras fuentes se
extraen selectivamente para su uso por aplicaciones
analíticas y de consultas por usuarios.
Data Warehouse es una arquitectura de
almacenamiento de datos que permite a los
ejecutivos de negocios organizar, comprender y
utilizar sus datos para tomar decisiones estratégicas.
DATAMART
Un Datamart es una base de datos departamental,
especializada en el almacenamiento de los datos de
un área de negocio específica. Se caracteriza por
disponer la estructura óptima de datos para analizar
la información al detalle desde todas las
perspectivas que afecten a los procesos de dicho
departamento. Un datamart puede ser alimentado
desde los datos de un datawarehouse, o integrar por
si mismo un compendio de distintas fuentes de
información.
Los datamarts que están dotados con estas
estructuras óptimas de análisis presentan las
siguientes ventajas:
› Poco volumen de datos
› Mayor rapidez de consulta
› Consultas SQL y/o MDX sencillas
› Validación directa de la información
› Facilidad para la historización de los datos
CARACTERISTICAS DE UN DATA WAREHOUSE
› Integrado: los datos almacenados en el Data Warehouse deben integrarse en una estructura consistente, por lo que las
inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele
estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
CARACTERISTICAS DE UN DATA WAREHOUSE
› Temático: sólo los datos necesarios para
el proceso de generación del
conocimiento del negocio se integran
desde el entorno operacional. Los datos
se organizan por temas para facilitar su
acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los
datos sobre clientes pueden ser
consolidados en una única tabla del Data
Warehouse. De esta forma, las peticiones
de información sobre clientes serán más
fáciles de responder dado que toda la
información reside en el mismo lugar.
CARACTERISTICAS DE UN DATA WAREHOUSE
› Histórico: el tiempo es parte implícita de la información contenida en un Data Warehouse. En los sistemas operacionales, los
datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información
almacenada en el Data Warehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Data
Warehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
CARACTERISTICAS DE UN DATA WAREHOUSE
› No volátil: el almacén de información de un Data
Warehouse existe para ser leído, y no modificado. La
información es por tanto permanente, significando la
actualización del Data Warehouse la incorporación de
los últimos valores que tomaron las distintas variables
contenidas en él sin ningún tipo de acción sobre lo que
ya existía.
ARQUITECTURA DE UN DATA WAREHOUSE
PLANIFICACION DE INFRAESTRUCTURA DE UN DATA WAREHOUSE
Definición del proyecto
Descripción
Objetivos del proyecto
• Metodología para el desarrollo de
la Base de Datos
• Asignación de recursos
• Plan de contingencia
Análisis de requerimientos
Descripción
Casos de uso
Requerimientos funcionales
Requerimientos no funcionales
Diseño de la base de datos
Diseño conceptual
Diseño lógico
Diseño físico
• Software
• Nomenclatura
• Diseño de relaciones
• Definición de reglas de la BD
PLANIFICACION DE INFRAESTRUCTURA DE UN DATA WAREHOUSE
Comprensión del negocio Se trata de entender claramente los requerimientos y objetivos del proyecto siempre desde una
visión de negocio. Esta fase se subdivide a su vez en las siguientes categorías:
› Definición de los objetivos de negocio y criterios de éxito del negocio (inicial, objetivos de negocio y criterios de éxito
del negocio).
› Evaluación de la situación (inventario de recursos, requisitos supuestos y requerimientos, riesgos y contingencias,
terminología y costes y beneficios)
› Definición de los objetivos del Data Warehouse (objetivos y criterios de éxito).
› Realización del plan del proyecto (plan del proyecto y valoración inicial de herramientas y técnicas).
METODOLOGIA DE KIMBALL PARA EL DATA WAREHOUSE
La metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle).
Este ciclo de vida del proyecto de DW, está basado en cuatro principios básicos:
› Centrarse en el negocio: Hay que concentrarse en la identificación de los requerimientos del negocio y su valor
asociado, y usar estos esfuerzos para desarrollar relaciones sólidas con el negocio, agudizando el análisis del mismo
y la competencia consultiva de los implementadores.
› Construir una infraestructura de información adecuada: Diseñar una base de información única, integrada, fácil de
usar, de alto rendimiento donde se reflejará la amplia gama de requerimientos de negocio identificados en la
empresa.
› Realizar entregas en incrementos significativos: crear el almacén de datos (DW) en incrementos entregables en
plazos de 6 a 12 meses. Hay que usa el valor de negocio de cada elemento identificado para determinar el orden de
aplicación de los incrementos. En esto la metodología se parece a las metodologías ágiles de construcción de
software.
› Ofrecer la solución completa: proporcionar todos los elementos necesarios para entregar valor a los usuarios de
negocios. Para comenzar, esto significa tener un almacén de datos sólido, bien diseñado, con calidad probada, y
accesible. También se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes y análisis
avanzado, capacitación, soporte, sitio web y documentación.
METODOLOGIA DE KIMBALL PARA EL DATA WAREHOUSE
METODOLOGIA DE INMON PARA EL DATA WAREHOUSE
En este modelo, la premisa es que la información se almacene al máximo nivel de detalle (garantizando la futura exploración
de los datos), permaneciendo invariable y no volátil, de manera que los cambios que sufran los datos a lo largo del tiempo
queden registrados sin que puedan modificarse o eliminarse.
En este modelo, la premisa es que la información se almacene al máximo nivel de detalle (garantizando la futura exploración
de los datos), permaneciendo invariable y no volátil, de manera que los cambios que sufran los datos a lo largo del tiempo
queden registrados sin que puedan modificarse o eliminarse.
Estas son las claves fundamentales de la arquitectura defendida por Inmon, conocida como ‘Corporate Information Factory
(CIF)’, donde el DataWarehouse centraliza todos los datos de la compañía para alimentar, a continuación, pequeños
DataMarts temáticos, que serán los puntos de acceso para las herramientas de reporting. En este sentido, cada
departamento tendrá su propio DataMart, abastecido con la información del DataWarehouse, listo para su análisis y
explotación.
METODOLOGIA DE INMON PARA EL DATA WAREHOUSE
DIFERENCIAS ENTRE KIMBALL E INMON

Más contenido relacionado

PPTX
Delta lake and the delta architecture
DOC
Data mining notes
PPT
Designing Scalable Data Warehouse Using MySQL
PPTX
Non relational databases-no sql
DOC
Ejercicio 3
PPTX
MongoDB Avanzado
PPTX
Basic oracle-database-administration
PPTX
Estilos arquitectónicos
Delta lake and the delta architecture
Data mining notes
Designing Scalable Data Warehouse Using MySQL
Non relational databases-no sql
Ejercicio 3
MongoDB Avanzado
Basic oracle-database-administration
Estilos arquitectónicos

La actualidad más candente (20)

PPTX
proposito del protocolo ip
PPTX
Dwdm 2(data warehouse)
PPTX
Modelo entidad relacion
PPT
PPTX
Algoritmo Blowfish y TwoFish
PDF
Intro to Neo4j and Graph Databases
PPTX
Presentation of Apache Cassandra
PPTX
Apache HBase™
PPTX
Relational and non relational database 7
PPTX
Introduction to Apache Spark
PPTX
Tipos de servidores
PPT
Multidimensional Database Design & Architecture
PPTX
How to understand and analyze Apache Hive query execution plan for performanc...
ODP
Elasticsearch for beginners
PPTX
Data warehousing - Dr. Radhika Kotecha
PPTX
Ibm db2
PPTX
NOSQL Databases types and Uses
PPTX
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
DOCX
Conexion servidor con Samba
PPSX
Introduction to Vertica (Architecture & More)
proposito del protocolo ip
Dwdm 2(data warehouse)
Modelo entidad relacion
Algoritmo Blowfish y TwoFish
Intro to Neo4j and Graph Databases
Presentation of Apache Cassandra
Apache HBase™
Relational and non relational database 7
Introduction to Apache Spark
Tipos de servidores
Multidimensional Database Design & Architecture
How to understand and analyze Apache Hive query execution plan for performanc...
Elasticsearch for beginners
Data warehousing - Dr. Radhika Kotecha
Ibm db2
NOSQL Databases types and Uses
UNIDAD 2 DISEÑO DE LAS BASES DE DATOS DISTRIBUIDAS
Conexion servidor con Samba
Introduction to Vertica (Architecture & More)
Publicidad

Similar a Data-Warehouse-I.pdf (20)

PPTX
Datawarehouse para inteligencia de negocios
PDF
Inteligencia de Negocios – Data Warehouse
PPTX
Data warehouse
PDF
Data warehouse
PPT
La planificacion segun_data_ware_house
PDF
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
PPT
Data warehouse
PPTX
Data warehouse
PDF
Bussiness inteligence
PDF
Bussiness inteligence
DOCX
Que Es Un Data Warehouse
PPTX
Datawarehouse2
PDF
Introduccion datawarehouse
DOCX
Almacenes de datos
PPTX
Que Es Un Data Warehouse
PPTX
Data warehouse
PPTX
Data warehouse
PPTX
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
PPTX
Data ware house
PPTX
SEM2-DataWarehouseJHJHyDatamart (1).pptx
Datawarehouse para inteligencia de negocios
Inteligencia de Negocios – Data Warehouse
Data warehouse
Data warehouse
La planificacion segun_data_ware_house
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Data warehouse
Data warehouse
Bussiness inteligence
Bussiness inteligence
Que Es Un Data Warehouse
Datawarehouse2
Introduccion datawarehouse
Almacenes de datos
Que Es Un Data Warehouse
Data warehouse
Data warehouse
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Data ware house
SEM2-DataWarehouseJHJHyDatamart (1).pptx
Publicidad

Último (20)

PDF
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
PPTX
Inteligencia_Artificialdelosk_Mujer.pptx
PDF
Mapa mental.pdf esquema de realización en general
PPTX
TICS EN HONDURAS, PAIS DE CENTROAMERICA.pptx
PPTX
FACTORES DE RIESGOS EN EL PERSONAL DE SALUD 2 DIAPOSITIVAS.pptx
PDF
Registro de Limpieza y Desinfección.pdf1
PDF
Los 10 mayores Fondos Soberanos de Riqueza (2025).pdf
PDF
REPORTE DE VICTIMAS POR HOMICIDIO DOLOSO IRAPUATO JULIO 2025
PPTX
Presentacion Capacitacion RC y RG (5).pptx
PPT
2010_06 FSI_ASBA Pruebas de Stress de Riesgo de Crédito El Caso Peruano MLUY_...
PDF
Riesgos en Negociaciones_comercio exterior.pdf
PDF
Pobreza por origen racial y zonas socialistas (1980, 2025 y 2030).pdf
PPTX
Copia de Plantilla VSL Method Como crear videos ee 7 minutos hipnoticods.pptx
PPTX
Tutoria 3. Unidad 2 PRUEBAS BIOLÓGICAS.pptx
PDF
Presentacion Gestion de Recursos DIA 1.pdf
DOCX
DUA 2025 para maestros especiales del área de español
PPTX
fisioterapia 6 semestre - ---- serealizo
PDF
Unidad Nº 1 Introduccion a Estadísticas
PPTX
CANALES DE DISTRIBUCION en comercio internacional
PDF
Rendición_Pública_de_Cuentas_Inicial_2019.pdf
Presentación_rendición_de_cuentas_2020_26-FEB-2021.pdf
Inteligencia_Artificialdelosk_Mujer.pptx
Mapa mental.pdf esquema de realización en general
TICS EN HONDURAS, PAIS DE CENTROAMERICA.pptx
FACTORES DE RIESGOS EN EL PERSONAL DE SALUD 2 DIAPOSITIVAS.pptx
Registro de Limpieza y Desinfección.pdf1
Los 10 mayores Fondos Soberanos de Riqueza (2025).pdf
REPORTE DE VICTIMAS POR HOMICIDIO DOLOSO IRAPUATO JULIO 2025
Presentacion Capacitacion RC y RG (5).pptx
2010_06 FSI_ASBA Pruebas de Stress de Riesgo de Crédito El Caso Peruano MLUY_...
Riesgos en Negociaciones_comercio exterior.pdf
Pobreza por origen racial y zonas socialistas (1980, 2025 y 2030).pdf
Copia de Plantilla VSL Method Como crear videos ee 7 minutos hipnoticods.pptx
Tutoria 3. Unidad 2 PRUEBAS BIOLÓGICAS.pptx
Presentacion Gestion de Recursos DIA 1.pdf
DUA 2025 para maestros especiales del área de español
fisioterapia 6 semestre - ---- serealizo
Unidad Nº 1 Introduccion a Estadísticas
CANALES DE DISTRIBUCION en comercio internacional
Rendición_Pública_de_Cuentas_Inicial_2019.pdf

Data-Warehouse-I.pdf

  • 1. INTRODUCCION AL DATA WAREHOUSE Un data warehouse es un repositorio unificado para todos los datos que recogen los diversos sistemas de una empresa. El repositorio puede ser físico o lógico y hace hincapié en la captura de datos de diversas fuentes sobre todo para fines analíticos y de acceso. Normalmente, un data warehouse se aloja en un servidor corporativo o en la nube. Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP) y otras fuentes se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por usuarios. Data Warehouse es una arquitectura de almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar sus datos para tomar decisiones estratégicas.
  • 2. DATAMART Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información. Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las siguientes ventajas: › Poco volumen de datos › Mayor rapidez de consulta › Consultas SQL y/o MDX sencillas › Validación directa de la información › Facilidad para la historización de los datos
  • 3. CARACTERISTICAS DE UN DATA WAREHOUSE › Integrado: los datos almacenados en el Data Warehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
  • 4. CARACTERISTICAS DE UN DATA WAREHOUSE › Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del Data Warehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.
  • 5. CARACTERISTICAS DE UN DATA WAREHOUSE › Histórico: el tiempo es parte implícita de la información contenida en un Data Warehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Data Warehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Data Warehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
  • 6. CARACTERISTICAS DE UN DATA WAREHOUSE › No volátil: el almacén de información de un Data Warehouse existe para ser leído, y no modificado. La información es por tanto permanente, significando la actualización del Data Warehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
  • 7. ARQUITECTURA DE UN DATA WAREHOUSE
  • 8. PLANIFICACION DE INFRAESTRUCTURA DE UN DATA WAREHOUSE Definición del proyecto Descripción Objetivos del proyecto • Metodología para el desarrollo de la Base de Datos • Asignación de recursos • Plan de contingencia Análisis de requerimientos Descripción Casos de uso Requerimientos funcionales Requerimientos no funcionales Diseño de la base de datos Diseño conceptual Diseño lógico Diseño físico • Software • Nomenclatura • Diseño de relaciones • Definición de reglas de la BD
  • 9. PLANIFICACION DE INFRAESTRUCTURA DE UN DATA WAREHOUSE Comprensión del negocio Se trata de entender claramente los requerimientos y objetivos del proyecto siempre desde una visión de negocio. Esta fase se subdivide a su vez en las siguientes categorías: › Definición de los objetivos de negocio y criterios de éxito del negocio (inicial, objetivos de negocio y criterios de éxito del negocio). › Evaluación de la situación (inventario de recursos, requisitos supuestos y requerimientos, riesgos y contingencias, terminología y costes y beneficios) › Definición de los objetivos del Data Warehouse (objetivos y criterios de éxito). › Realización del plan del proyecto (plan del proyecto y valoración inicial de herramientas y técnicas).
  • 10. METODOLOGIA DE KIMBALL PARA EL DATA WAREHOUSE La metodología se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle). Este ciclo de vida del proyecto de DW, está basado en cuatro principios básicos: › Centrarse en el negocio: Hay que concentrarse en la identificación de los requerimientos del negocio y su valor asociado, y usar estos esfuerzos para desarrollar relaciones sólidas con el negocio, agudizando el análisis del mismo y la competencia consultiva de los implementadores. › Construir una infraestructura de información adecuada: Diseñar una base de información única, integrada, fácil de usar, de alto rendimiento donde se reflejará la amplia gama de requerimientos de negocio identificados en la empresa. › Realizar entregas en incrementos significativos: crear el almacén de datos (DW) en incrementos entregables en plazos de 6 a 12 meses. Hay que usa el valor de negocio de cada elemento identificado para determinar el orden de aplicación de los incrementos. En esto la metodología se parece a las metodologías ágiles de construcción de software. › Ofrecer la solución completa: proporcionar todos los elementos necesarios para entregar valor a los usuarios de negocios. Para comenzar, esto significa tener un almacén de datos sólido, bien diseñado, con calidad probada, y accesible. También se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio web y documentación.
  • 11. METODOLOGIA DE KIMBALL PARA EL DATA WAREHOUSE
  • 12. METODOLOGIA DE INMON PARA EL DATA WAREHOUSE En este modelo, la premisa es que la información se almacene al máximo nivel de detalle (garantizando la futura exploración de los datos), permaneciendo invariable y no volátil, de manera que los cambios que sufran los datos a lo largo del tiempo queden registrados sin que puedan modificarse o eliminarse. En este modelo, la premisa es que la información se almacene al máximo nivel de detalle (garantizando la futura exploración de los datos), permaneciendo invariable y no volátil, de manera que los cambios que sufran los datos a lo largo del tiempo queden registrados sin que puedan modificarse o eliminarse. Estas son las claves fundamentales de la arquitectura defendida por Inmon, conocida como ‘Corporate Information Factory (CIF)’, donde el DataWarehouse centraliza todos los datos de la compañía para alimentar, a continuación, pequeños DataMarts temáticos, que serán los puntos de acceso para las herramientas de reporting. En este sentido, cada departamento tendrá su propio DataMart, abastecido con la información del DataWarehouse, listo para su análisis y explotación.
  • 13. METODOLOGIA DE INMON PARA EL DATA WAREHOUSE