SlideShare una empresa de Scribd logo
TEMARIO:
 DATA WAREHOUSE.
AUTORES:
 FERNANDEZ ROMAN, Ismael.
 CHANCAFE QUESQUEN,Stalin.
DOCENTE:
 ING.Mg. SANCHEZ GUEVARA, OMAR ANTONIO
INDICE
INTRODUCCION.......................................................................................................................4
OBJETIVOS....................................................................................................................................5
EN RESUMEN................................................................................................................................5
IMPORTANCIA DEL DATA WAREHOUSE .......................................................................................5
ANTES DE IMPLEMENTAR UN DATA WAREHOUSE.......................................................................5
LA ARQUITECTURA Y COMPLEJIDAD EN GENERAL DEL ENTORNO........................6
Empresas Que Usan Data Warehouse ..................................................................................6
CARACTERÍSTICAS DE UN DATA WAREHOUSE.............................................................6
DIFERENCIAS ENTRE UN SISTEMA DE DATA WAREHOUSE Y APLICACIONES TRADICIONALES......7
METODOLOGÍAS DE DISEÑO DE DATA WAREHOUSE..................................................8
METODOLOGÍA DE KIMBALL (BOTTOM-UP) ....................................................................8
METODOLOGÍA AGIL PARA LA IMPLEMENTACIÓN DE UN DW...................................8
ARQUITECTURA DE UN DATA WAREHOUSE ..................................................................9
FLUJO DE DATOS DE UN DATAWAREHOSE....................................................................9
ARQUITECTURA DE UN DATA WAREHOUSE. .................................................................9
ELEMENTOS DE LA ARQ. DE UN DATAWARE HOUSE................................................10
PROYECTO DE ELABORACION DE UN DATA WAREHOUSE .....................................11
Fase 1: Organización..............................................................................................................11
Factores En La Planificacion De Un Data Warehouse.......................................................11
2 ESTRATEGIAS PARA EL DESARROLLO DE UN DATA WAREHOUSE ...................11
ESTABLECER UN AMBIENTE "DATA WAREHOUSE VIRTUAL“. .................................11
3.- ESTRATEGIAS PARA EL DISEÑO DE UN DATA WAREHOUSE ...........................12
4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE ............................12
FASE 2: DESARROLLO.........................................................................................................12
CONSIDERACIONES PREVIAS AL DESARROLLO DE UN DATA WAREHOUSE.....13
3 ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE......14
4 CONFIABILIDAD DE LOS DATOS....................................................................................14
5 FACTORES DECISIVOS PARA DECIDIR EL DESARROLLO DE UN DATA
WAREHOUSE .........................................................................................................................15
FASE 3: IMPLEMENTACION ........................................................................................................15
1 ELEMENTOS A CONSIDERAR EN LA IMPLEMENTACION...........................................................15
2 ESTRATEGIAS PARA EL PROCESO DE IMPLEMENTACION ........................................................15
3 ESTRATEGIAS EN LA IMPLEMENTACION ...................................................................16
FASE 4: EVALUACION..........................................................................................................16
EVALUACION DE RENDIMIENTO DE LA INVERSION. ..................................................16
CASO PRÁCTICO...................................................................................................................17
1.1 COSTOS Y BENEFICIOS..........................................................................................................17
BENEFICIOS A OBTENER....................................................................................................17
EL MODELO DE DATOS.......................................................................................................18
DATA WAREHOUSE VS BD OPERACIONAL ...................................................................19
EXTRACCIÓN, TRANSFORMACIÓN Y CARGA...............................................................................19
TRANSFORMACIÓN DE DIMENSIONES DE CAMBIO LENTO ........................................................20
CONTROL DE LA EJECUCIÓN.......................................................................................................20
EJEMPLOS DE PAQUETES EN ETL. .................................................................................20
FLUJO DE CONTROL Y FLUJO DE DATOS. ....................................................................20
CONCLUSIONES DEL DATAWAREHOUSE. ...................................................................................21
REFERENCIAS BIOGRAFICAS. ......................................................................................................22
P á g i n a 4 | 22
INTRODUCCION.
El Data Warehouse es una tecnología para el manejo de la información construido sobre
la base de optimizar el uso y análisis de la misma utilizado por las organizaciones para
adaptarse a los vertiginosos cambios en los mercados. Su función esencial es ser la
base de un sistema de información gerencial, es decir, debe cumplir el rol de integrador
de información proveniente de fuentes funcionalmente distintas (Bases Corporativas,
Bases propias, de Sistemas Externos, etc.) y brindar una visión integrada de dicha
información, especialmente enfocada hacia la toma de decisiones por parte del personal
jerárquico de la organización. Es un sitio donde se almacena de manera integrada toda
la información resultante de la operatoria diaria de la organización. Además, se
almacenan datos estratégicos y tácticos con el objetivo de obtener información
estratégica y táctica que pueden ser de gran ayuda para aplicar sobre los mismos
técnicas de análisis de datos encaminadas a obtener información oculta (Data Mining).
Esta información incluye movimientos que modifican el estado del negocio, cualquier
interacción que se tenga con los clientes y proveedores, y cualquier dato adicional que
ayude a comprender la evolución del negocio. Esta tecnología ayuda a la organización
a responder preguntas esenciales para la toma de decisiones que le permitan obtener
ventajas competitivas y mejorar su posición en el mercado en el que operan.
Algunas de las preguntas podrían ser:
 Cuál es el perfil de mis clientes?
 Cómo es su comportamiento?
 Cuál es la rentabilidad que me deja?
 Cuál es el riesgo que corro con él?
 Qué servicios y productos utiliza y cómo puedo incrementarlos?
 Etc.
P á g i n a 5 | 22
OBJETIVOS
 Hacer la información de la organización accesible
 Hacer a la información de la organización consistente
 Controlar el acceso efectivo a los datos
 Generar información de manera flexible
 Servir de ayuda a la toma de decisiones
EN RESUMEN
 Un Data Warehouse tiene como objetivo almacenar y proveer a la
Organización de información relevante y a tiempo.
IMPORTANCIA DEL DATA WAREHOUSE
 Mejorar la Entrega de Información:.
 Mejorar el Proceso de Toma de Decisiones
 Impacto Positivo sobre los Procesos Empresariales
ANTES DE IMPLEMENTAR UN DATA WAREHOUSE.
 La amplitud; el número de diferentes temas y puntos de foco
 Fuentes que proveerán datos brutos.
 Los medios por los cuales los datos se transportan de las
aplicaciones fuente y son cargados al Data Warehouse.
 Las reglas de negocio que se aplican a la data en bruto para producir
activos de datos de alta calidad.
 Las bases de datos receptoras, en la que estos activos de datos
serán almacenados.
 Los activos de datos; los elementos, el nivel de detalle de cada
elemento, y cuánta historia se ha mantenido, por ejemplo.
 La Inteligencia de negocio
 Herramientas de nivel usuario para acceder a los activos de datos.
P á g i n a 6 | 22
LA ARQUITECTURA Y COMPLEJIDAD EN GENERAL DEL ENTORNO.
Empresas Que Usan Data Warehouse
 Royal bank of canada
 Paypal
 3M
 Coca-Cola Company
 Verizon
 Ford Motor Company
 Herramientas de nivel usuario para acceder a los activos de datos.
 La arquitectura y complejidad en general del entorno.
CARACTERÍSTICAS DE UN DATA WAREHOUSE
 Orientado a un tema
 Administra grandes cantidades de información
 Guarda información en diversos medios de almacenamiento
 Comprende múltiples versiones de uno (o varios) esquema de base
de datos
 Condensa y agrega información
 Integra y asocia información de muchas fuentes
P á g i n a 7 | 22
DIFERENCIAS ENTRE UN SISTEMA DE DATA WAREHOUSE Y APLICACIONES TRADICIONALES
SISTEMAS TRADICIONALES DATAWAREHOUSE
• Predomina la actualización.
• Actividad operativa (día a
día).
• Proceso puntual.
• Estabilidad.
• Datos desagregados.
• Dato actual.
• Respuesta de la transacción
inmediata.
• Estructura relacional.
• Usuarios de perfiles bajos.
• Explotación de la información
relacionada con operatividad
de cada aplicación
• Predomina la consulta
• Análisis y decisión estratégica.
• Proceso masivo.
• Dinamismo.
• Niveles de detalle/agregación.
• Dato histórico.
• Respuesta masiva
• Estructura Multidimensional
• Usuarios de perfiles altos.
• Explotación de información
interna y externa relacionada
con el negocio.
P á g i n a 8 | 22
METODOLOGÍAS DE DISEÑO DE DATA WAREHOUSE.
METODOLOGÍA DE KIMBALL (BOTTOM-UP)
METODOLOGÍA AGIL PARA LA IMPLEMENTACIÓN DE UN DW
P á g i n a 9 | 22
ARQUITECTURA DE UN DATA WAREHOUSE
FLUJO DE DATOS DE UN DATAWAREHOSE
ARQUITECTURA DE UN DATA WAREHOUSE.
• Base de datos operacional / Nivel de base de datos externo.
• Nivel de acceso a los datos
• Nivel de organización de datos
• Nivel de data warehouse
• Nivel de acceso a la información
• Nivel de gestión de proceso
P á g i n a 10 | 22
ELEMENTOS DE LA ARQ. DE UN DATAWARE HOUSE
 Base de datos operacional / Nivel de base de datos externo (Fuentes de datos)
 Los sistemas operacionales procesan datos para apoyar las necesidades
operacionales críticas, tales como ERPs, SCMs, también se procesa información
de fuentes de datos externas, tales como de la internet, INEI, BCRP.
 Nivel de acceso a los datos
 Es responsable de la interfaces entre las herramientas de acceso a la
información y las bases de datos operacionales. En algunos casos, esto es todo
lo que un usuario final necesita para realizar estas interfases se utiliza el SQL
(Standar Query Lenguaje)
 Nivel de organización de datos
 El componente final de la arquitectura data Warehouse es la organización de los
datos, incluye todos los procesos necesarios como seleccionar, editar, resumir,
combinar y cargar datos en el depósito y acceder a la información desde bases
de datos operacionales y/o externas
 Nivel de data warehouse
 En un data Warehouse físico, el almacenaje de data procesada, incluso en forma
redundante
 Nivel de acceso a la información
 Este nivel se incluye el hardware y software involucrados en representar y
proveer de información al usuario final normalmente usa día a día. Por ejemplo:
Excel, Lotus 1-2-3, Focus, Access, SAS, etc.
 Nivel de gestión de proceso
 El nivel de gestión de procesos tiene que ver con la programación de diversas
tareas que deben realizarse para construir y mantener actualizado el data
warehouse y la información del directorio de datos.
P á g i n a 11 | 22
PROYECTO DE ELABORACION DE UN DATA WAREHOUSE
Fase 1: Organización
Factores En La Planificacion De Un Data Warehouse
 Establecer una asociación de usuarios, gestión y grupos
 Construir prototipos rápida y frecuentemente
 Implementación incremental
 Reportar activamente y publicar los casos exitosos
ESTRATEGIAS PARA EL DESARROLLO DE UN DATA WAREHOUSE
¿Quién es el auditorio?
¿Cuál es el alcance?
¿Qué tipo de data warehouse debería construirse?
1ra.:
ESTABLECER UN AMBIENTE "DATA WAREHOUSE VIRTUAL“.
2da.:
Construir una copia de los datos operacionales desde un sistema operacional único y
posibilitar al data warehouse de una serie de herramientas de acceso a la información.
3ra.:
Finalmente, la estrategia data warehousing óptima es seleccionar el número de
usuarios basados en el valor de la empresa y hacer un análisis de sus puntos,
preguntas y necesidades de acceso a datos.
P á g i n a 12 | 22
3.- ESTRATEGIAS PARA EL DISEÑO DE UN DATA WAREHOUSE
1ra. : Los usuarios de los data warehouses usualmente no conocen mucho sobre sus
requerimientos y necesidades como los usuarios operacionales.
2da.: El diseño de un data warehouse, con frecuencia involucra lo que se piensa en
términos más amplios y con conceptos del negocio más difíciles de definir que en el
diseño de un sistema operacional. Al respecto, un data warehouse está bastante cerca
a Reingeniería de los Procesos del Negocio (Business Process Reengineering).
3ra.: Finalmente, la estrategia de diseño ideal para un data warehousing es
generalmente de afuera hacia adentro (outside-in) a diferencia de arriba hacia abajo
(top-down).
4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE
1ra.:
Un data warehouse es una inversión buena sólo si los usuarios finales realmente pueden
conseguir información vital más rápida y más barata de lo que obtienen con la tecnología
actual.
2da.:
La administración debe reconocer que el mantenimiento de la estructura del data
warehouse es tan crítico como el mantenimiento de cualquier otra aplicación de misión-
crítica.
3ra.:
La gestión debe comprender también que si se embarcan sobre un programa data
warehousing, se crearán nuevas demandas sobre sus sistemas operacionales, que son:
Demandas para mejorar datos
Demandas para una data consistente
Demandas para diferentes tipos de datos, etc.
FASE 2: DESARROLLO
 Se ha reconocido los beneficios del procesamiento analítico en línea (On
Line Analytical Processing - OLAP), más allá de las áreas tradicionales de
marketing y finanzas.
 El crecimiento de la computación cliente/servidor, ha creado servidores de
hardware y software más poderosos y sofisticados que nunca. Los
servidores de hoy compiten con las mainframes de ayer y ofrecen
arquitecturas de memoria tecnológicamente superiores, procesadores de
alta velocidad y capacidades de almacenamiento masivas
P á g i n a 13 | 22
CONSIDERACIONES PREVIAS AL DESARROLLO DE UN DATA WAREHOUSE.
Hay muchas maneras para desarrollar data warehouses como tantas organizaciones
existen. Sin embargo, hay un número de dimensiones diferentes que necesitan ser
consideradas:
 Alcance de un data warehouse
 Redundancia de datos
 Tipo de usuario final
P á g i n a 14 | 22
3 ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE
 Si se escoge incorrectamente, el data warehouse se convierte en una gran
empresa con problemas difíciles de trabajar en su entorno, costoso para
arreglar y difícil de justificar.
 Para conseguir que la implementación del
depósito tenga un inicio exitoso, se necesita
enfocar hacia tres bloques claves de
construcción:
 Arquitectura total del depósito
 Arquitecturas del servidor
 Sistemas de Gestión de Base de Dato
Hay muchas maneras para desarrollar data
warehouses como tantas organizaciones existen. Sin
embargo, hay un número de dimensiones diferentes
que necesitan ser consideradas:
 Alcance de un data warehouse
 Redundancia de datos
 Tipo de usuario final
4 CONFIABILIDAD DE LOS DATOS
 La data "sucia" es peligrosa. Las herramientas de limpieza especializadas y las
formas de programar de los clientes proporcionan redes de seguridad.
 No importa cómo esté diseñado un programa o cuán hábilmente se use. Si se
alimenta mala información, se obtendrá resultados incorrectos o falsos.
 Desafortunadamente, los datos que se usan satisfactoriamente en las
aplicaciones de línea comercial operacionales pueden ser basura en lo que
concierne a la aplicación data warehousing
P á g i n a 15 | 22
FACTORES DECISIVOS PARA DECIDIR EL DESARROLLO DE UN DATA
WAREHOUSE
 La data sucia es un serio peligro para el éxito de un proyecto de data
warehouse. Dependiendo del alcance del problema, simplemente podría no ser
posible dirigirlo rápidamente y abaratarlo.
Los principales factores son:
 El tiempo que toma la programación interna
 El costo de las herramientas
 Los gerentes de proyectos de Data Warehouse necesitan evaluar el problema
con realismo, los recursos internos disponibles para distribuirlos y seleccionar
la solución que se adapte a la planilla y presupuesto del proyecto, o modificar
la planilla y el presupuesto para solucionar el problema.
FASE 3: IMPLEMENTACION
1 ELEMENTOS A CONSIDERAR EN LA IMPLEMENTACION.
 Proyecto Total o Proyecto en Fases
 Es más viable el desarrollo de un proyecto en fases que produzcan resultados a
corto plazo que el desarrollo de un proyecto que entregue resultados al término
de varios años. Por ello, el proyecto debe estar centrado en un área o un
proceso.
 Modelo lógico de datos
 El modelo lógico de datos debe tener un alcance más alto y cubrir todas las áreas
de interés, así como los procesos más estratégicos de cada una de ellas.
 Proyecto Especializado o Proyecto Base
 Decidir sobre qué tipo de proyecto, es algo complicado. Un proyecto
especializado soporta directamente un proceso específico, por ejemplo:
retención de clientes.
 Un proyecto base entrega capacidad genérica de análisis a todos los usuarios
que tengan acceso al data warehouse, pero no tiene, entre sus funcionalidades,
la solución de un problema específico o el soporte especializado de un proceso
específico.
2 ESTRATEGIAS PARA EL PROCESO DE IMPLEMENTACION
 Identificar el problema en el cual el uso estratégico de la información
detallada, permita conseguir una solución para generar una ventaja
competitiva o un ahorro de costos.
 Definir el modelo lógico de datos a implementar para resolver el problema
planteado.
P á g i n a 16 | 22
3 ESTRATEGIAS EN LA IMPLEMENTACION
 Definir el mejor diseño físico para el modelo de datos. El diseño físico debe
estar orientado a generar buen rendimiento en el procesamiento de
consultas, a diferencia del modelo lógico que está orientado al usuario y a la
facilidad de consulta.
 Definir los procesos de extracción, filtro, transformación de información y
carga de datos que se deben implementar para poblar ese modelo de datos.
 Definir los procesos de administración de la información que permanece en
el data warehouse
 Definir las formas de consultas a la información del data warehouse que se
le proporcionará al usuario. Para ésto, debe considerarse la necesidad de
resolver un problema y la potencia de consulta.
 Completar el modelo de consulta base, relativo al área seleccionada.
 Implementar los procesos estratégicos del área de trabajo, es decir,
implementar herramientas especializadas de scoring, herramientas
especializadas para inducción de conocimiento (Data Mining), etc.
 Completar las áreas de interés, en forma similar a lo descrito anteriormente.
FASE 4: EVALUACION.
EVALUACION DE RENDIMIENTO DE LA INVERSION.
¿Qué clases de costos excedieron el presupuesto en más del 10% en cada
uno de los 12 meses pasados?
¿Se aumentaron los presupuestos en más de 5% para cualquier área dentro
de los últimos 18 meses?
¿Cómo especificar las clases de gasto entre diferentes departamentos?
¿Entre divisiones? ¿A través de las regiones geográficas?
¿Cómo tener márgenes de operación sobre los dos últimos años en cada
área de negocio? Donde han disminuido los márgenes, ¿se han
incrementado los costos?
P á g i n a 17 | 22
CASO PRÁCTICO
 En un estudio encargado por 20 vendedores y consultores, se encontró un
Retorno Promedio Total de la inversión (Return On Investment-ROI) de
401%.También, se excluyeron los proyectos fracasados, así como los
ejecutados excepcionalmente, tanto buenos como malos.
1.1 COSTOS Y BENEFICIOS
BENEFICIOS A OBTENER
Para La Empresa
El data warehouse hace lo posible por aprovechar el valor potencial enorme de los
recursos de información de la empresa y volver ese valor potencial en valor verdadero.
 Para los Usuarios
El data warehouse extiende el alcance de la información para que puedan accesar
directamente en línea, lo que a la vez contribuye en su capacidad para operar con mayor
efectividad las tareas rutinarias o no.
P á g i n a 18 | 22
 Para la Organización en Tecnologías de Información
El data warehouse enriquece las capacidades del usuario autosuficiente y hace
lo factible para ofrecer nuevos servicios a los usuarios, sin interferir con las
aplicaciones cotidianas de producción
EL MODELO DE DATOS
 Es el modelo por el cual se diseña el esquema de funcionamiento de la Base
de Datos que provee al Data Warehouse.
 Existen varios enfoques en este sentido:
 Fábrica de información corporativa (CIF): incluyen ODS, data warehouse y
data marts, junto con otras varias interfaces de aplicaciones y el ambiente
operacional, fue desarrollada por Bill Inmon, Claudia Imhoff, y Ryan Sousa

 Esquema en estrella: Este método replica las estructuras multidimensionales
de hechos y dimensiones, pero usa tablas de RDBMS, específicamente
tablas de hechos y tablas de dimensiones. Se dejan de lado las reglas de
normalización de base de datos y se ponen los datos donde tienen más
sentido

 Data vault (Arquitectura de modelado fundacional común -CFIMA):
 Esta es una arquitectura de integración de datos que contiene una base de
datos orientada al detalle que contiene un conjunto de tablas normalizadas
únicamente enlazadas que soportan una o más áreas funcionales de las
tablas de negocio con tablas satélites para rastrear cambios históricos. Este
enfoque híbrido reúne lo mejor del cruce entre la tercera forma normal (3NF)
P á g i n a 19 | 22
DATA WAREHOUSE VS BD OPERACIONAL
EXTRACCIÓN, TRANSFORMACIÓN Y CARGA.
Extracción
 Multiples Fuentes
 Orientadas a trabajo Batch : cagas de estos sistemas son más fuertes
cuando los sistemas de producción tienen poca carga
 Conectvidad a diferentes tecnologías, diferentes manejadores de BDs
Transformación
 Manipulación de data compleja
 Reunión de diferentes fuentes
 Implementación de reglas de negocio
 Limpiado, ordenado, eliminación de duplicidades
 Optimizado para el desempeño y para grandes volúmenes
 Carga
 Cargar la data en tablas de hechos y dimensiones
 Produce un historial en archivos o en la BD para trazabilidad
Otros
 Controla los flujos de ejecución: maneja las dependencias entre tareas,
control de ejecución, gestión de errores, registros históricos.
TRANSFORMACIÓN DE BÚSQUEDA DIFUSA
 Busca valores en las tablas usando criterios difusos
 Ejemplo: Para un campo de texto la data puede contener muchas
variantes de la misma palabra (“friend”, “a friend”, “freind”, etc). La
lógica difusa puede ayudar a reunir las variantes.
Uso de Base de
Datos
Operacionales
Uso de
Data Warehouse
Muchos usuarios
concurrentes
Pocos usuarios
concurrentes
Consultas
predefinidas y
actualizables
Consultas complejas,
frecuentemente
no anticipadas.
Cantidades pequeñas
de datos resumidas.
Cantidades grandes
de datos resumidas.
Requerimientos de
respuesta inmediata
Requerimientos de
respuesta no críticos
P á g i n a 20 | 22
TRANSFORMACIÓN DE DIMENSIONES DE CAMBIO LENTO
Ayuda a manejar la actualización de una dimensión de cambio lento
o Ejemplo : la información sobre los consumidores cambia
constantemente, pero queremos una historia de estos
 Cambio de dirección no queremos el valor anteiror (reemplazo)
 Un cambio en el valor VAT  ‘duplicamos’ la entrada del
consumidor agregando los datos adicionales (para propósitos
financieros)
CONTROL DE LA EJECUCIÓN
 Los datos son muy sensibles, la calidad de los reportes depende la calidad
de estos
 Cargar un Data Warehouse puede implicar reglas complejas de extracción,
transformación y carga
 Los usuarios del negocio no confiarán en un DW si no confían en su carga
EJEMPLOS DE PAQUETES EN ETL.
FLUJO DE CONTROL Y FLUJO DE DATOS.
Customer table Bill Table
Customer ID Last Name City Company VAT Nb Bill ID Customer ID Date Amount
FR 1234567 67890 00012345 01/01/2008 500 €
FR 5555566 89567 00012345 01/06/2008 400 €
00012345 DESPRIEE Paris
OLTP Model
DimCustomer FactBill Table
Customer Key Customer ID Last Name City Company VAT Nb Bill ID Customer Key Date Amount
2048 00012345 DESPRIEE Paris FR 1234567 67890 2048 01/01/2008 500 €
3057 00012345 DESPRIEE Paris FR 5555566 89567 3057 01/06/2008 400 €
OLAP Model
Clave sustituta
P á g i n a 21 | 22
CONCLUSIONES DEL DATAWAREHOUSE.
El concepto de DWH está teniendo una gran aplicación en la actualidad para el
desarrollo de las empresas, como almacén de datos. Sus objetivos incluyen la reducción
de los costes de almacenamiento y una mayor velocidad de respuesta frente a las
consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre años,
más que sobre meses de información.
Para diseñar una buena arquitectura de DWH es necesario como primer paso conocer
bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas
que nos van a suministrar los datos. Además, hacer un buen diseño del área de
transformación de datos.
P á g i n a 22 | 22
REFERENCIAS BIOGRAFICAS.
 Conceptos de data ware Alhouse
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
 Almacen de datos- https://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos.com
 Qué es un Data Warehouse http://www.dataprix.com/que-es-un-
datawarehouse.es
 Introduccion Al Concepto Data Warehousing
http://www.ongei.gob.pe/publica/metodologias/Lib5084/11.htm
 What is data warehouse http://searchsqlserver.techtarget.com/definition/data-
warehouse-php
 Fundamentos de Data Warehouse
http://artemisa.unicauca.edu.com/~ecaldon/docs/bd/fundamentosdedatawareh
ouse.asp

Más contenido relacionado

PDF
rueda-tecnologica-datamart
PPTX
Almacenes, mineria y análisis de datos
PDF
Proyecto mineria de_datos_caso_2
DOCX
Aplicando Ciencia de Datos en una Organización
PPT
Unidad2 Bases De Datos Para L Toma De Desiciones
PPTX
Exposicion mineria de datos - Franklin Rodríguez
PDF
Data Mining: Torturando los datos hasta que confiesen
PPSX
Kdd fase1
rueda-tecnologica-datamart
Almacenes, mineria y análisis de datos
Proyecto mineria de_datos_caso_2
Aplicando Ciencia de Datos en una Organización
Unidad2 Bases De Datos Para L Toma De Desiciones
Exposicion mineria de datos - Franklin Rodríguez
Data Mining: Torturando los datos hasta que confiesen
Kdd fase1

Similar a Data warehouse (20)

PDF
datamart paso a paso
DOCX
La teoría general de sistema en las organizaciones
PPTX
Data warehouse
DOC
Smdb Equipo11
DOC
Smdb Equipo11
DOC
Smdb Equipo11
DOC
Smdb Equipo11
PDF
Smdb Equipo11
PDF
Introducción a R - con minería de datos
PDF
Pfc itziar angoitia_espinosa
DOC
Ensayo Omar Enrique Aguilar Aquino
PDF
Inventarios proceso
PPTX
Que Es Un Data Warehouse
PDF
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
PPTX
Data warehouse
PDF
Analisis comparativo
PDF
Analisis comparativo my-sql-oracle
DOC
S M D B E Q U I P O11
PDF
Filosofía Six Sigma.pdf
PDF
Proyecto De Grado
datamart paso a paso
La teoría general de sistema en las organizaciones
Data warehouse
Smdb Equipo11
Smdb Equipo11
Smdb Equipo11
Smdb Equipo11
Smdb Equipo11
Introducción a R - con minería de datos
Pfc itziar angoitia_espinosa
Ensayo Omar Enrique Aguilar Aquino
Inventarios proceso
Que Es Un Data Warehouse
Guía - Ejemplo - Modelos - Power BI Desktop.pdf
Data warehouse
Analisis comparativo
Analisis comparativo my-sql-oracle
S M D B E Q U I P O11
Filosofía Six Sigma.pdf
Proyecto De Grado
Publicidad

Más de Ris Fernandez (20)

PDF
Constancia
PDF
Proyecto de ingenieria movil
PDF
Fale portugues vol 1 autor maria harumi de ponce
PDF
Novo avenida brasil_1.pdf
PDF
Implementacion de base de datos
PDF
Preguntas desarrolladas sobre inteligencia artificial i
PDF
Proyecto final video_vigilancia_mpch
PPTX
Vision de los usuarios frente a las RADIACIONES NO IONIZANTES
PDF
Recaudación del Sector Telecomunicaciones
PPT
Desarrollo de la Telecomunicaciones , Las Antenas Y la Salud. UNMSM
PDF
Comision de lucha contra delitos aduaneros y la pirateria
PPTX
Ilegalidad e informalidad en los servicios de Telecomunicaciones
PPTX
Exp lambayeque 09 2016
PDF
Evento lambayeque fitel setiembre 2016
DOCX
Trabajo de bigadata
DOCX
Tutorial de instalacion de pentaho
PDF
estructura y normas para el cableado estructurado para una empresa educativa
DOCX
Manual de instalacion de Dns-linux-ubuntu
PDF
instalacion-y-configuracion-de-un-servidor-dns-bind-en-ubuntu
PPTX
Principales Herramientas de Business Intelligence
Constancia
Proyecto de ingenieria movil
Fale portugues vol 1 autor maria harumi de ponce
Novo avenida brasil_1.pdf
Implementacion de base de datos
Preguntas desarrolladas sobre inteligencia artificial i
Proyecto final video_vigilancia_mpch
Vision de los usuarios frente a las RADIACIONES NO IONIZANTES
Recaudación del Sector Telecomunicaciones
Desarrollo de la Telecomunicaciones , Las Antenas Y la Salud. UNMSM
Comision de lucha contra delitos aduaneros y la pirateria
Ilegalidad e informalidad en los servicios de Telecomunicaciones
Exp lambayeque 09 2016
Evento lambayeque fitel setiembre 2016
Trabajo de bigadata
Tutorial de instalacion de pentaho
estructura y normas para el cableado estructurado para una empresa educativa
Manual de instalacion de Dns-linux-ubuntu
instalacion-y-configuracion-de-un-servidor-dns-bind-en-ubuntu
Principales Herramientas de Business Intelligence
Publicidad

Último (20)

PPTX
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
PPTX
clase MICROCONTROLADORES ago-dic 2019.pptx
PPTX
diego universidad convergencia e información
PDF
LIBRO UNIVERSITARIO SOFTWARE PARA INGENIERIA BN.pdf
DOCX
Cumplimiento normativo y realidad laboral
PDF
TRABAJO DE ANÁLISIS DE RIESGOS EN PROYECTOS
PDF
SESION 9 seguridad IZAJE DE CARGAS.pdf ingenieria
PDF
FUNCION CUADRATICA FUNCIONES RAIZ CUADRADA
PPTX
TOPOGRAFÍA - INGENIERÍA CIVIL - PRESENTACIÓN
PDF
Curso Introductorio de Cristales Liquidos
PDF
Prevención de estrés laboral y Calidad de sueño - LA PROTECTORA.pdf
PPTX
376060032-Diapositivas-de-Ingenieria-ESTRUCTURAL.pptx
PDF
Módulo V. Tema 2. Disruptive & Transformation 2024 v.0.4.pdf
PPTX
MANEJO DE QUIMICOS Y SGA GRUPO Mnsr Aleman.pptx
PDF
LIBRO UNIVERSITARIO INTELIGENCIA ALGORITMICA BN.pdf
PPTX
PPT SESIÓN 6 Los Injertos.- Micropropagación e Injertos Clonales.pptx
PPTX
A8B08CED-D3D9-415C-B4A3-2A6CA6409A48.1.1Presentación Dirección 2022 unidade...
PPTX
Presentación - Taller interpretación iso 9001-Solutions consulting learning.pptx
PDF
Clase 2 de abril Educacion adistancia.pdf
PDF
Seguridad vial en carreteras mexico 2003.pdf
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
clase MICROCONTROLADORES ago-dic 2019.pptx
diego universidad convergencia e información
LIBRO UNIVERSITARIO SOFTWARE PARA INGENIERIA BN.pdf
Cumplimiento normativo y realidad laboral
TRABAJO DE ANÁLISIS DE RIESGOS EN PROYECTOS
SESION 9 seguridad IZAJE DE CARGAS.pdf ingenieria
FUNCION CUADRATICA FUNCIONES RAIZ CUADRADA
TOPOGRAFÍA - INGENIERÍA CIVIL - PRESENTACIÓN
Curso Introductorio de Cristales Liquidos
Prevención de estrés laboral y Calidad de sueño - LA PROTECTORA.pdf
376060032-Diapositivas-de-Ingenieria-ESTRUCTURAL.pptx
Módulo V. Tema 2. Disruptive & Transformation 2024 v.0.4.pdf
MANEJO DE QUIMICOS Y SGA GRUPO Mnsr Aleman.pptx
LIBRO UNIVERSITARIO INTELIGENCIA ALGORITMICA BN.pdf
PPT SESIÓN 6 Los Injertos.- Micropropagación e Injertos Clonales.pptx
A8B08CED-D3D9-415C-B4A3-2A6CA6409A48.1.1Presentación Dirección 2022 unidade...
Presentación - Taller interpretación iso 9001-Solutions consulting learning.pptx
Clase 2 de abril Educacion adistancia.pdf
Seguridad vial en carreteras mexico 2003.pdf

Data warehouse

  • 1. TEMARIO:  DATA WAREHOUSE. AUTORES:  FERNANDEZ ROMAN, Ismael.  CHANCAFE QUESQUEN,Stalin. DOCENTE:  ING.Mg. SANCHEZ GUEVARA, OMAR ANTONIO
  • 2. INDICE INTRODUCCION.......................................................................................................................4 OBJETIVOS....................................................................................................................................5 EN RESUMEN................................................................................................................................5 IMPORTANCIA DEL DATA WAREHOUSE .......................................................................................5 ANTES DE IMPLEMENTAR UN DATA WAREHOUSE.......................................................................5 LA ARQUITECTURA Y COMPLEJIDAD EN GENERAL DEL ENTORNO........................6 Empresas Que Usan Data Warehouse ..................................................................................6 CARACTERÍSTICAS DE UN DATA WAREHOUSE.............................................................6 DIFERENCIAS ENTRE UN SISTEMA DE DATA WAREHOUSE Y APLICACIONES TRADICIONALES......7 METODOLOGÍAS DE DISEÑO DE DATA WAREHOUSE..................................................8 METODOLOGÍA DE KIMBALL (BOTTOM-UP) ....................................................................8 METODOLOGÍA AGIL PARA LA IMPLEMENTACIÓN DE UN DW...................................8 ARQUITECTURA DE UN DATA WAREHOUSE ..................................................................9 FLUJO DE DATOS DE UN DATAWAREHOSE....................................................................9 ARQUITECTURA DE UN DATA WAREHOUSE. .................................................................9 ELEMENTOS DE LA ARQ. DE UN DATAWARE HOUSE................................................10 PROYECTO DE ELABORACION DE UN DATA WAREHOUSE .....................................11 Fase 1: Organización..............................................................................................................11 Factores En La Planificacion De Un Data Warehouse.......................................................11 2 ESTRATEGIAS PARA EL DESARROLLO DE UN DATA WAREHOUSE ...................11 ESTABLECER UN AMBIENTE "DATA WAREHOUSE VIRTUAL“. .................................11 3.- ESTRATEGIAS PARA EL DISEÑO DE UN DATA WAREHOUSE ...........................12 4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE ............................12 FASE 2: DESARROLLO.........................................................................................................12 CONSIDERACIONES PREVIAS AL DESARROLLO DE UN DATA WAREHOUSE.....13 3 ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE......14 4 CONFIABILIDAD DE LOS DATOS....................................................................................14 5 FACTORES DECISIVOS PARA DECIDIR EL DESARROLLO DE UN DATA WAREHOUSE .........................................................................................................................15 FASE 3: IMPLEMENTACION ........................................................................................................15 1 ELEMENTOS A CONSIDERAR EN LA IMPLEMENTACION...........................................................15 2 ESTRATEGIAS PARA EL PROCESO DE IMPLEMENTACION ........................................................15 3 ESTRATEGIAS EN LA IMPLEMENTACION ...................................................................16 FASE 4: EVALUACION..........................................................................................................16 EVALUACION DE RENDIMIENTO DE LA INVERSION. ..................................................16
  • 3. CASO PRÁCTICO...................................................................................................................17 1.1 COSTOS Y BENEFICIOS..........................................................................................................17 BENEFICIOS A OBTENER....................................................................................................17 EL MODELO DE DATOS.......................................................................................................18 DATA WAREHOUSE VS BD OPERACIONAL ...................................................................19 EXTRACCIÓN, TRANSFORMACIÓN Y CARGA...............................................................................19 TRANSFORMACIÓN DE DIMENSIONES DE CAMBIO LENTO ........................................................20 CONTROL DE LA EJECUCIÓN.......................................................................................................20 EJEMPLOS DE PAQUETES EN ETL. .................................................................................20 FLUJO DE CONTROL Y FLUJO DE DATOS. ....................................................................20 CONCLUSIONES DEL DATAWAREHOUSE. ...................................................................................21 REFERENCIAS BIOGRAFICAS. ......................................................................................................22
  • 4. P á g i n a 4 | 22 INTRODUCCION. El Data Warehouse es una tecnología para el manejo de la información construido sobre la base de optimizar el uso y análisis de la misma utilizado por las organizaciones para adaptarse a los vertiginosos cambios en los mercados. Su función esencial es ser la base de un sistema de información gerencial, es decir, debe cumplir el rol de integrador de información proveniente de fuentes funcionalmente distintas (Bases Corporativas, Bases propias, de Sistemas Externos, etc.) y brindar una visión integrada de dicha información, especialmente enfocada hacia la toma de decisiones por parte del personal jerárquico de la organización. Es un sitio donde se almacena de manera integrada toda la información resultante de la operatoria diaria de la organización. Además, se almacenan datos estratégicos y tácticos con el objetivo de obtener información estratégica y táctica que pueden ser de gran ayuda para aplicar sobre los mismos técnicas de análisis de datos encaminadas a obtener información oculta (Data Mining). Esta información incluye movimientos que modifican el estado del negocio, cualquier interacción que se tenga con los clientes y proveedores, y cualquier dato adicional que ayude a comprender la evolución del negocio. Esta tecnología ayuda a la organización a responder preguntas esenciales para la toma de decisiones que le permitan obtener ventajas competitivas y mejorar su posición en el mercado en el que operan. Algunas de las preguntas podrían ser:  Cuál es el perfil de mis clientes?  Cómo es su comportamiento?  Cuál es la rentabilidad que me deja?  Cuál es el riesgo que corro con él?  Qué servicios y productos utiliza y cómo puedo incrementarlos?  Etc.
  • 5. P á g i n a 5 | 22 OBJETIVOS  Hacer la información de la organización accesible  Hacer a la información de la organización consistente  Controlar el acceso efectivo a los datos  Generar información de manera flexible  Servir de ayuda a la toma de decisiones EN RESUMEN  Un Data Warehouse tiene como objetivo almacenar y proveer a la Organización de información relevante y a tiempo. IMPORTANCIA DEL DATA WAREHOUSE  Mejorar la Entrega de Información:.  Mejorar el Proceso de Toma de Decisiones  Impacto Positivo sobre los Procesos Empresariales ANTES DE IMPLEMENTAR UN DATA WAREHOUSE.  La amplitud; el número de diferentes temas y puntos de foco  Fuentes que proveerán datos brutos.  Los medios por los cuales los datos se transportan de las aplicaciones fuente y son cargados al Data Warehouse.  Las reglas de negocio que se aplican a la data en bruto para producir activos de datos de alta calidad.  Las bases de datos receptoras, en la que estos activos de datos serán almacenados.  Los activos de datos; los elementos, el nivel de detalle de cada elemento, y cuánta historia se ha mantenido, por ejemplo.  La Inteligencia de negocio  Herramientas de nivel usuario para acceder a los activos de datos.
  • 6. P á g i n a 6 | 22 LA ARQUITECTURA Y COMPLEJIDAD EN GENERAL DEL ENTORNO. Empresas Que Usan Data Warehouse  Royal bank of canada  Paypal  3M  Coca-Cola Company  Verizon  Ford Motor Company  Herramientas de nivel usuario para acceder a los activos de datos.  La arquitectura y complejidad en general del entorno. CARACTERÍSTICAS DE UN DATA WAREHOUSE  Orientado a un tema  Administra grandes cantidades de información  Guarda información en diversos medios de almacenamiento  Comprende múltiples versiones de uno (o varios) esquema de base de datos  Condensa y agrega información  Integra y asocia información de muchas fuentes
  • 7. P á g i n a 7 | 22 DIFERENCIAS ENTRE UN SISTEMA DE DATA WAREHOUSE Y APLICACIONES TRADICIONALES SISTEMAS TRADICIONALES DATAWAREHOUSE • Predomina la actualización. • Actividad operativa (día a día). • Proceso puntual. • Estabilidad. • Datos desagregados. • Dato actual. • Respuesta de la transacción inmediata. • Estructura relacional. • Usuarios de perfiles bajos. • Explotación de la información relacionada con operatividad de cada aplicación • Predomina la consulta • Análisis y decisión estratégica. • Proceso masivo. • Dinamismo. • Niveles de detalle/agregación. • Dato histórico. • Respuesta masiva • Estructura Multidimensional • Usuarios de perfiles altos. • Explotación de información interna y externa relacionada con el negocio.
  • 8. P á g i n a 8 | 22 METODOLOGÍAS DE DISEÑO DE DATA WAREHOUSE. METODOLOGÍA DE KIMBALL (BOTTOM-UP) METODOLOGÍA AGIL PARA LA IMPLEMENTACIÓN DE UN DW
  • 9. P á g i n a 9 | 22 ARQUITECTURA DE UN DATA WAREHOUSE FLUJO DE DATOS DE UN DATAWAREHOSE ARQUITECTURA DE UN DATA WAREHOUSE. • Base de datos operacional / Nivel de base de datos externo. • Nivel de acceso a los datos • Nivel de organización de datos • Nivel de data warehouse • Nivel de acceso a la información • Nivel de gestión de proceso
  • 10. P á g i n a 10 | 22 ELEMENTOS DE LA ARQ. DE UN DATAWARE HOUSE  Base de datos operacional / Nivel de base de datos externo (Fuentes de datos)  Los sistemas operacionales procesan datos para apoyar las necesidades operacionales críticas, tales como ERPs, SCMs, también se procesa información de fuentes de datos externas, tales como de la internet, INEI, BCRP.  Nivel de acceso a los datos  Es responsable de la interfaces entre las herramientas de acceso a la información y las bases de datos operacionales. En algunos casos, esto es todo lo que un usuario final necesita para realizar estas interfases se utiliza el SQL (Standar Query Lenguaje)  Nivel de organización de datos  El componente final de la arquitectura data Warehouse es la organización de los datos, incluye todos los procesos necesarios como seleccionar, editar, resumir, combinar y cargar datos en el depósito y acceder a la información desde bases de datos operacionales y/o externas  Nivel de data warehouse  En un data Warehouse físico, el almacenaje de data procesada, incluso en forma redundante  Nivel de acceso a la información  Este nivel se incluye el hardware y software involucrados en representar y proveer de información al usuario final normalmente usa día a día. Por ejemplo: Excel, Lotus 1-2-3, Focus, Access, SAS, etc.  Nivel de gestión de proceso  El nivel de gestión de procesos tiene que ver con la programación de diversas tareas que deben realizarse para construir y mantener actualizado el data warehouse y la información del directorio de datos.
  • 11. P á g i n a 11 | 22 PROYECTO DE ELABORACION DE UN DATA WAREHOUSE Fase 1: Organización Factores En La Planificacion De Un Data Warehouse  Establecer una asociación de usuarios, gestión y grupos  Construir prototipos rápida y frecuentemente  Implementación incremental  Reportar activamente y publicar los casos exitosos ESTRATEGIAS PARA EL DESARROLLO DE UN DATA WAREHOUSE ¿Quién es el auditorio? ¿Cuál es el alcance? ¿Qué tipo de data warehouse debería construirse? 1ra.: ESTABLECER UN AMBIENTE "DATA WAREHOUSE VIRTUAL“. 2da.: Construir una copia de los datos operacionales desde un sistema operacional único y posibilitar al data warehouse de una serie de herramientas de acceso a la información. 3ra.: Finalmente, la estrategia data warehousing óptima es seleccionar el número de usuarios basados en el valor de la empresa y hacer un análisis de sus puntos, preguntas y necesidades de acceso a datos.
  • 12. P á g i n a 12 | 22 3.- ESTRATEGIAS PARA EL DISEÑO DE UN DATA WAREHOUSE 1ra. : Los usuarios de los data warehouses usualmente no conocen mucho sobre sus requerimientos y necesidades como los usuarios operacionales. 2da.: El diseño de un data warehouse, con frecuencia involucra lo que se piensa en términos más amplios y con conceptos del negocio más difíciles de definir que en el diseño de un sistema operacional. Al respecto, un data warehouse está bastante cerca a Reingeniería de los Procesos del Negocio (Business Process Reengineering). 3ra.: Finalmente, la estrategia de diseño ideal para un data warehousing es generalmente de afuera hacia adentro (outside-in) a diferencia de arriba hacia abajo (top-down). 4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE 1ra.: Un data warehouse es una inversión buena sólo si los usuarios finales realmente pueden conseguir información vital más rápida y más barata de lo que obtienen con la tecnología actual. 2da.: La administración debe reconocer que el mantenimiento de la estructura del data warehouse es tan crítico como el mantenimiento de cualquier otra aplicación de misión- crítica. 3ra.: La gestión debe comprender también que si se embarcan sobre un programa data warehousing, se crearán nuevas demandas sobre sus sistemas operacionales, que son: Demandas para mejorar datos Demandas para una data consistente Demandas para diferentes tipos de datos, etc. FASE 2: DESARROLLO  Se ha reconocido los beneficios del procesamiento analítico en línea (On Line Analytical Processing - OLAP), más allá de las áreas tradicionales de marketing y finanzas.  El crecimiento de la computación cliente/servidor, ha creado servidores de hardware y software más poderosos y sofisticados que nunca. Los servidores de hoy compiten con las mainframes de ayer y ofrecen arquitecturas de memoria tecnológicamente superiores, procesadores de alta velocidad y capacidades de almacenamiento masivas
  • 13. P á g i n a 13 | 22 CONSIDERACIONES PREVIAS AL DESARROLLO DE UN DATA WAREHOUSE. Hay muchas maneras para desarrollar data warehouses como tantas organizaciones existen. Sin embargo, hay un número de dimensiones diferentes que necesitan ser consideradas:  Alcance de un data warehouse  Redundancia de datos  Tipo de usuario final
  • 14. P á g i n a 14 | 22 3 ELEMENTOS CLAVES PARA EL DESARROLLO DE UN DATA WAREHOUSE  Si se escoge incorrectamente, el data warehouse se convierte en una gran empresa con problemas difíciles de trabajar en su entorno, costoso para arreglar y difícil de justificar.  Para conseguir que la implementación del depósito tenga un inicio exitoso, se necesita enfocar hacia tres bloques claves de construcción:  Arquitectura total del depósito  Arquitecturas del servidor  Sistemas de Gestión de Base de Dato Hay muchas maneras para desarrollar data warehouses como tantas organizaciones existen. Sin embargo, hay un número de dimensiones diferentes que necesitan ser consideradas:  Alcance de un data warehouse  Redundancia de datos  Tipo de usuario final 4 CONFIABILIDAD DE LOS DATOS  La data "sucia" es peligrosa. Las herramientas de limpieza especializadas y las formas de programar de los clientes proporcionan redes de seguridad.  No importa cómo esté diseñado un programa o cuán hábilmente se use. Si se alimenta mala información, se obtendrá resultados incorrectos o falsos.  Desafortunadamente, los datos que se usan satisfactoriamente en las aplicaciones de línea comercial operacionales pueden ser basura en lo que concierne a la aplicación data warehousing
  • 15. P á g i n a 15 | 22 FACTORES DECISIVOS PARA DECIDIR EL DESARROLLO DE UN DATA WAREHOUSE  La data sucia es un serio peligro para el éxito de un proyecto de data warehouse. Dependiendo del alcance del problema, simplemente podría no ser posible dirigirlo rápidamente y abaratarlo. Los principales factores son:  El tiempo que toma la programación interna  El costo de las herramientas  Los gerentes de proyectos de Data Warehouse necesitan evaluar el problema con realismo, los recursos internos disponibles para distribuirlos y seleccionar la solución que se adapte a la planilla y presupuesto del proyecto, o modificar la planilla y el presupuesto para solucionar el problema. FASE 3: IMPLEMENTACION 1 ELEMENTOS A CONSIDERAR EN LA IMPLEMENTACION.  Proyecto Total o Proyecto en Fases  Es más viable el desarrollo de un proyecto en fases que produzcan resultados a corto plazo que el desarrollo de un proyecto que entregue resultados al término de varios años. Por ello, el proyecto debe estar centrado en un área o un proceso.  Modelo lógico de datos  El modelo lógico de datos debe tener un alcance más alto y cubrir todas las áreas de interés, así como los procesos más estratégicos de cada una de ellas.  Proyecto Especializado o Proyecto Base  Decidir sobre qué tipo de proyecto, es algo complicado. Un proyecto especializado soporta directamente un proceso específico, por ejemplo: retención de clientes.  Un proyecto base entrega capacidad genérica de análisis a todos los usuarios que tengan acceso al data warehouse, pero no tiene, entre sus funcionalidades, la solución de un problema específico o el soporte especializado de un proceso específico. 2 ESTRATEGIAS PARA EL PROCESO DE IMPLEMENTACION  Identificar el problema en el cual el uso estratégico de la información detallada, permita conseguir una solución para generar una ventaja competitiva o un ahorro de costos.  Definir el modelo lógico de datos a implementar para resolver el problema planteado.
  • 16. P á g i n a 16 | 22 3 ESTRATEGIAS EN LA IMPLEMENTACION  Definir el mejor diseño físico para el modelo de datos. El diseño físico debe estar orientado a generar buen rendimiento en el procesamiento de consultas, a diferencia del modelo lógico que está orientado al usuario y a la facilidad de consulta.  Definir los procesos de extracción, filtro, transformación de información y carga de datos que se deben implementar para poblar ese modelo de datos.  Definir los procesos de administración de la información que permanece en el data warehouse  Definir las formas de consultas a la información del data warehouse que se le proporcionará al usuario. Para ésto, debe considerarse la necesidad de resolver un problema y la potencia de consulta.  Completar el modelo de consulta base, relativo al área seleccionada.  Implementar los procesos estratégicos del área de trabajo, es decir, implementar herramientas especializadas de scoring, herramientas especializadas para inducción de conocimiento (Data Mining), etc.  Completar las áreas de interés, en forma similar a lo descrito anteriormente. FASE 4: EVALUACION. EVALUACION DE RENDIMIENTO DE LA INVERSION. ¿Qué clases de costos excedieron el presupuesto en más del 10% en cada uno de los 12 meses pasados? ¿Se aumentaron los presupuestos en más de 5% para cualquier área dentro de los últimos 18 meses? ¿Cómo especificar las clases de gasto entre diferentes departamentos? ¿Entre divisiones? ¿A través de las regiones geográficas? ¿Cómo tener márgenes de operación sobre los dos últimos años en cada área de negocio? Donde han disminuido los márgenes, ¿se han incrementado los costos?
  • 17. P á g i n a 17 | 22 CASO PRÁCTICO  En un estudio encargado por 20 vendedores y consultores, se encontró un Retorno Promedio Total de la inversión (Return On Investment-ROI) de 401%.También, se excluyeron los proyectos fracasados, así como los ejecutados excepcionalmente, tanto buenos como malos. 1.1 COSTOS Y BENEFICIOS BENEFICIOS A OBTENER Para La Empresa El data warehouse hace lo posible por aprovechar el valor potencial enorme de los recursos de información de la empresa y volver ese valor potencial en valor verdadero.  Para los Usuarios El data warehouse extiende el alcance de la información para que puedan accesar directamente en línea, lo que a la vez contribuye en su capacidad para operar con mayor efectividad las tareas rutinarias o no.
  • 18. P á g i n a 18 | 22  Para la Organización en Tecnologías de Información El data warehouse enriquece las capacidades del usuario autosuficiente y hace lo factible para ofrecer nuevos servicios a los usuarios, sin interferir con las aplicaciones cotidianas de producción EL MODELO DE DATOS  Es el modelo por el cual se diseña el esquema de funcionamiento de la Base de Datos que provee al Data Warehouse.  Existen varios enfoques en este sentido:  Fábrica de información corporativa (CIF): incluyen ODS, data warehouse y data marts, junto con otras varias interfaces de aplicaciones y el ambiente operacional, fue desarrollada por Bill Inmon, Claudia Imhoff, y Ryan Sousa   Esquema en estrella: Este método replica las estructuras multidimensionales de hechos y dimensiones, pero usa tablas de RDBMS, específicamente tablas de hechos y tablas de dimensiones. Se dejan de lado las reglas de normalización de base de datos y se ponen los datos donde tienen más sentido   Data vault (Arquitectura de modelado fundacional común -CFIMA):  Esta es una arquitectura de integración de datos que contiene una base de datos orientada al detalle que contiene un conjunto de tablas normalizadas únicamente enlazadas que soportan una o más áreas funcionales de las tablas de negocio con tablas satélites para rastrear cambios históricos. Este enfoque híbrido reúne lo mejor del cruce entre la tercera forma normal (3NF)
  • 19. P á g i n a 19 | 22 DATA WAREHOUSE VS BD OPERACIONAL EXTRACCIÓN, TRANSFORMACIÓN Y CARGA. Extracción  Multiples Fuentes  Orientadas a trabajo Batch : cagas de estos sistemas son más fuertes cuando los sistemas de producción tienen poca carga  Conectvidad a diferentes tecnologías, diferentes manejadores de BDs Transformación  Manipulación de data compleja  Reunión de diferentes fuentes  Implementación de reglas de negocio  Limpiado, ordenado, eliminación de duplicidades  Optimizado para el desempeño y para grandes volúmenes  Carga  Cargar la data en tablas de hechos y dimensiones  Produce un historial en archivos o en la BD para trazabilidad Otros  Controla los flujos de ejecución: maneja las dependencias entre tareas, control de ejecución, gestión de errores, registros históricos. TRANSFORMACIÓN DE BÚSQUEDA DIFUSA  Busca valores en las tablas usando criterios difusos  Ejemplo: Para un campo de texto la data puede contener muchas variantes de la misma palabra (“friend”, “a friend”, “freind”, etc). La lógica difusa puede ayudar a reunir las variantes. Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeñas de datos resumidas. Cantidades grandes de datos resumidas. Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos
  • 20. P á g i n a 20 | 22 TRANSFORMACIÓN DE DIMENSIONES DE CAMBIO LENTO Ayuda a manejar la actualización de una dimensión de cambio lento o Ejemplo : la información sobre los consumidores cambia constantemente, pero queremos una historia de estos  Cambio de dirección no queremos el valor anteiror (reemplazo)  Un cambio en el valor VAT  ‘duplicamos’ la entrada del consumidor agregando los datos adicionales (para propósitos financieros) CONTROL DE LA EJECUCIÓN  Los datos son muy sensibles, la calidad de los reportes depende la calidad de estos  Cargar un Data Warehouse puede implicar reglas complejas de extracción, transformación y carga  Los usuarios del negocio no confiarán en un DW si no confían en su carga EJEMPLOS DE PAQUETES EN ETL. FLUJO DE CONTROL Y FLUJO DE DATOS. Customer table Bill Table Customer ID Last Name City Company VAT Nb Bill ID Customer ID Date Amount FR 1234567 67890 00012345 01/01/2008 500 € FR 5555566 89567 00012345 01/06/2008 400 € 00012345 DESPRIEE Paris OLTP Model DimCustomer FactBill Table Customer Key Customer ID Last Name City Company VAT Nb Bill ID Customer Key Date Amount 2048 00012345 DESPRIEE Paris FR 1234567 67890 2048 01/01/2008 500 € 3057 00012345 DESPRIEE Paris FR 5555566 89567 3057 01/06/2008 400 € OLAP Model Clave sustituta
  • 21. P á g i n a 21 | 22 CONCLUSIONES DEL DATAWAREHOUSE. El concepto de DWH está teniendo una gran aplicación en la actualidad para el desarrollo de las empresas, como almacén de datos. Sus objetivos incluyen la reducción de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre años, más que sobre meses de información. Para diseñar una buena arquitectura de DWH es necesario como primer paso conocer bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas que nos van a suministrar los datos. Además, hacer un buen diseño del área de transformación de datos.
  • 22. P á g i n a 22 | 22 REFERENCIAS BIOGRAFICAS.  Conceptos de data ware Alhouse http://www.sinnexus.com/business_intelligence/datawarehouse.aspx  Almacen de datos- https://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos.com  Qué es un Data Warehouse http://www.dataprix.com/que-es-un- datawarehouse.es  Introduccion Al Concepto Data Warehousing http://www.ongei.gob.pe/publica/metodologias/Lib5084/11.htm  What is data warehouse http://searchsqlserver.techtarget.com/definition/data- warehouse-php  Fundamentos de Data Warehouse http://artemisa.unicauca.edu.com/~ecaldon/docs/bd/fundamentosdedatawareh ouse.asp