BASE DE DATOSMaestro: Carlos Arturo Torres Gastelu“Data warehouse”Numero de Equipo:  5Integrantes: Elvira Lázaro Irving Yañez Flores Victor Hazel
proporciona una plataforma de almacenamiento de datos completa y permite crear y gestionar su almacén de datos, con una perspectiva adaptable para lograr una mayor satisfacción a las organizaciones, ya que en esta nueva versión se mejoro la escalabilidad.Microsoft SQL server 2008 r2“DATA WAREHOUSE”
Características de la escalabilidadcontiene avances importantes respecto a versiones anteriores, por lo que funciona mejor cuando se crea, gestiona y se consulta en los almacenes de datos de gran tamaño
estrella de Ingreso  “Star Join”Con modelados dimensionalmente los almacenes de datos, una gran parte de su carga de trabajo suele consistir en lo que se conoce como la estrella de consultas de unión.Estas consultas siguen un patrón común que se une a la tabla de hechos con una o varias tablas de dimensiones, Además,suelen expresar las condiciones de filtro contra las columnas sin clave de las tablas de dimensiones y realizar una agregación en una columna de la tabla de hechos.La nueva tecnología empleada se basa en filtros de mapa de bits, también conocidos como filtros Bloom , que permite a SQL Server para eliminar las filas que no pueden obtener la tabla de hechos.
estrella de Ingreso  “Star Join”Esto ahorra una considerable cantidad de tiempo de CPU en comparación con tecnologías de procesamiento de consultas que utilizan los productos de la competencia.La nueva estrella de optimización de combinación utiliza una serie de combinaciones hash.
Ejecuta  consultas y  también reordena los mapas de bits durante la ejecución, poniendo la primera más prioritaria, de ahí la segunda más prioritaria, y así sucesivamente. Esto permite ahorrar más tiempo de CPU, porque una vez que una fila de  una tabla llega a fallar, este checa de nuevo en el mapa de bits, y  la fila se omite.El procesador de consultas en SQL Server aplica la optimización automática de consultas.
Tabla de Particiones Paralela “Partitioned Table Parallelism”El paralelismo tabla particionada (PTP) ayuda a obtener el máximo poder del hardware donde  aplicaciones de almacenamiento de datos suele reunir grandes cantidades de datos históricos en las tablas de hechos, que a menudo son divididas por la fecha.  mejora el rendimiento de los planes de consultas en paralelo con las tablas de particiones mediante una mejor utilización de la capacidad de procesamiento del hardware existente
Tabla de Particiones Paralela “Partitioned Table Parallelism”
Tabla de Particiones Paralela “Partitioned Table Parallelism”La ejecución de Q1 y Q2 en SQL Server 2005 puede generar un comportamiento inesperado. La ejecución de Q1 y Q2 en SQL Server 2008 R2 resultados en una mejor utilización del hardware disponible, y por lo tanto un mejor rendimiento, así como el comportamiento más predecible.
Alineados partición vistas indexadas “Partition-Aligned Indexed Views”Permiten crear y gestionar los agregados de resumen en su almacén de datos relacionales de manera más eficiente, y utilizarlos en situaciones en las que no podría usarlos con eficacia antes, la mejora de rendimiento de las consultas en un escenario típico, que tiene una tabla que se divide por la fecha, las vistas indizadas se definen en esta tabla para acelerar las consultas.En esta mejora significativa sobre SQL Server 2005, donde se debe quitar todas las vistas indizadas se define en una tabla con particiones antes de usar el funcionamiento del interruptor de ALTER TABLE para cambiar una partición en o fuera de ella. En SQL Server 2008 R2 ofrece las ventajas de las vistas indizadas en tablas con particiones grandes, evitando al mismo tiempo el costo de la reconstrucción de los agregados en toda una tabla con particiones. Estos beneficios incluyen el mantenimiento automático de los agregados
Alineados partición vistas indexadas “Partition-Aligned Indexed Views”
conjuntos de agrupación“GROUPING SETS”Permiten escribir una consulta que produce varias agrupaciones y devuelve un solo conjunto de resultados. El conjunto de resultados es equivalente a una UNION ALL de filas agrupadas de manera diferente. Permite escribir informes con varias agrupaciones con facilidad, con el rendimiento de las consultas mejorado.
“MERGE”La instrucción MERGE le permite realizar varias manipulaciones de bases de datos, en una tabla o vista dentro de una sola instrucción.La tabla o vista de destino está unido a una fuente de datos y las operaciones de DML se realizan en los resultados de la unión.La instrucción MERGE tiene tres cláusulas WHEN, cada una de ellas le permite realizar una acción específica de DML en una fila determinada en el conjunto de resultados:WHEN MATCHED.- Por cada fila que existe tanto en el objetivo y la fuente, permite actualizar o eliminar la fila en la tabla de destino.WHEN TARGET.- Por cada fila que existe en el origen pero no en el de destino, permite insertar una fila en el blanco.WHEN SOURCE.- Por cada fila que existe en el destino pero no en la fuente,permite actualizar o eliminar la fila en la tabla de destino.
“MERGE”En el contexto del almacenamiento de datos, la instrucción MERGE se utiliza para efectuar operaciones INSERT eficiente y operaciones de actualización de SlowlyChangingDimensions (SCD) y para mantener la tabla de hechos en varios escenarios comunes.La instrucción MERGE tiene mejores características pero en  SQL Server 2008 R2 también incluye una extensión de gran alcance para la instrucción INSERT que permite que se consumen las filas devueltas por la cláusula OUTPUT de una instrucción INSERT, UPDATE, DELETE o MERGE.
Captura de datos modificados “Change Data Capture”Proporciona un mecanismo eficaz para rastrear y recopilar datos de los cambios realizados en las tablas de usuario y le proporciona acceso a modificar los datos en un formato relacional fácil consumo. Normalmente, se utiliza en una base de datos operativos para capturar los cambios de movimiento posterior en el almacén de datos. Por lo tanto elimina la necesidad de utilizar métodos intrusivos, como desencadenadores de usuario, columnas de marca, etc.
Captura de datos modificados “Change Data Capture”
INSERTAR registros mínimamente“Minimally Logged INSERT”Cuando se escriben datos en una base de datos, se escriben en el disco dos veces: una para el registro, y otra vez en la propia base de datos.Sin embargo, es posible escribir los datos en el disco una sola vez, en algunos casos importantes que involucran la inserción de datos en las tablas existentes, lo que acelera los procesos de ETL de manera significativa. Consiste en el registro de sólo la información que se requiere para revertir la transacción.Mejora, el rendimiento de las grandes operaciones a gran escala INSERTAR al reducir el número de registros a ser escrito y la cantidad de espacio de registro necesario para completar la operación.
Compresión de datos“Data Compression”reduce el tamaño de tablas, índices o un subconjunto de las particiones de almacenamiento para poder reducir los datos redundantes. SQL Server ofrece dos tipos de compresión:La compresión ROW.- permite el almacenamiento de tipos de longitud fija, en formato variable de almacenamiento.La compresión PAGE.- reduce al mínimo, el almacenamiento de datos redundantes en la página mediante el almacenamiento de patrones de bytes, que ocurren comúnmente en la páginay luego hacen referencia a estos valores en las columnas respectivas.
Compresión de reserva de seguridad “Backup Compression”Reduce el tamaño de las copias de seguridad de SQL y ahorra en los medios de comunicación en disco para copias de seguridad de SQL. Esta reducción en el espacio y el tiempo a expensas de la utilización de ciclos de CPU.Pero se puede controlar la cantidad de CPU cuando es utilizado por las copias de seguridad utilizando el regulador de recursos.
regulador de recursos“Resource Governor”Permite controlar la cantidad de recursos de la CPU y la memoria asignada a diferentes partes de su carga de trabajo de la base de datos relacional.Se puede utilizar para evitar consultas fuera de controly de reservar recursos para una parte importante de su carga de trabajo. Objetivos principalesMonitoring.- permite el seguimiento del consumo de recursos por grupo de solicitudes.Predictability.-Proporcionala ejecución previsible de las cargas de trabajo en un ambiente donde no hay contención de recursos.
regulador de recursos“Resource Governor”Prioritization.- Habilita la priorización de las cargas de trabajo. Hay tres nuevos recursos que son importantes para la gobernación del recurso, grupos de carga de trabajo, fondos de recurso, clasificación (y clasificador de funciones definidas por el usuario) Grupo: Un grupo de carga de trabajo, o el grupo, son una categoría especificada de usuario de solicita lo que es similar según la clasificación gobierna que son aplicados a cada petición. El valor de un grupo está en la supervisión de conjunto de consumo de recurso y una política uniforme que es aplicada a todo solicita en un grupo. Un grupo define la política para sus miembros.
Fondo: Un fondo de recurso, o el fondo, representan una parte de los recursos físicos del servidor. Dependiendo sus ajustes, un fondo puede tener un tamaño fijo (sus ajustes de uso de recurso mínimos y máximos son iguales el uno al otro) o tienen una parte que es compartida entre múltiples fondos (su mínimo es menos que su máximo eficaz). "Compartido" en este caso simplemente quiere decir que los recursos van al fondo que solicita los recursos primero. En la configuración de falta todos los recursos son compartidos, así manteniendo la compatibilidad atrasada con la política de 2005 de Servidor SQL.Clasificación: La clasificación es un juego de las reglas escritas por usuario que permiten al Gobernador de Recurso clasificar solicita en los grupos descritos antes. Es puesto en práctica por un escalar Despachan-SQL la función definida por usuario (UDF) que es designado como " un clasificador UDF " para el Gobernador de Recurso.
Estos conceptos son ilustrados en la figura siguiente:
Mejoras de Servicios de Integración``Integration Services Improvements’’Haciendo ETL para mover datos de sus sistemas operacionales en su depósito de datos puede ser una tarea intensiva de tiempo. Para hacer este proceso más rápido, SQL el Servidor 2008 Servicios de Integración R2 (SSIS) introducen dos rasgos de adaptabilidad importantes: funcionamiento de consulta mejorado y funcionamiento de tubería de transformación mejorado.Funcionamiento de consulta es el componente de Consulta en SSIS este corre más rápido, y es aún más fácil al programa que en el Servidor SQL 2005. Una consulta prueba si cada fila en una corriente de filas tiene una fila que hace juego en otro dataset. Una consulta se parece a una base de datos la operación de juntura.
Funcionamiento de Tubería``Pipeline Performance’’En el Servidor SQL 2008 R2 SSIS, varios hilos puede trabajar juntos para hacer el trabajo que fuerzan un hilo solo a hacer por sí mismo en el Servidor SQL 2005 SSIS. Esto puede darle una aceleración de vario-pliegue en el funcionamiento ETL. En el Servidor SQL 2005 SSIS, el paralelismo de tubería son más de grano grueso. Cuando los usuarios tienen un paquete simple con uno o dos árboles de ejecución, hay sólo uno o dos procesadores usados, y el paquete no podría beneficiarse de una máquina de multiprocesador con más que unos procesadores. Incluso si los usuarios lógicamente hienden el flujo de datos por usando el multimolde, todos los caminos de salida de un multimolde pertenecen al mismo árbol de ejecución, y ellos son ejecutados en serie por el Servidor SQL 2005 SSIS la tarea de flujo de datos.
La figura siguiente muestra como el Servidor realzado SQL 2008 R2 el paralelismo de tubería trabaja.
Mejoras de Servicios de Análisis``Analysis Services Improvements’’SQL el Servidor 2008 Servicios de Análisis R2 (SSAS) dramáticamente mejoran la velocidad de pregunta con el nuevo cómputo de bloque, contestar, y rasgos de funcionamiento de base de datos escalables compartidos. La posibilidad de gestión también se mejora con la capacidad de sostener bases de datos mucho más grandes.MDX Pregunta Funcionamiento: Cómputo de Bloque El cómputo de bloque mejorado en el Servidor SQL 2008 R2 SSAS acelera la pregunta de MDX que procesa principalmente por hacer el trabajo solamente para los valores no nulos en un espacio de cubo. Ningún tiempo es gastado evaluando células nulas. La idea clave detrás del cómputo sub espacial es la mejor introducida por contrastándolo con una evaluación de célula-por-célula "ingenua" de un cálculo. Considere un cálculo Rolling Sum que suma las ventas para el año anterior y el año corriente, y una pregunta que solicita el Rolling Sum hacia 2005 para todos los productos.
Pregunta y Contesta Funcionamiento``Query and Write-back Performance’’El funcionamiento de contesta las operaciones, y preguntas sobre contestan datos, es mejorado en el Servidor SQL 2008 Servicios de Análisis R2. La célula contesta en Servicios de Análisis es la capacidad para usuarios finales para poner al día valores de célula en la hoja o niveles agregados. La célula contesta los empleos un especial contestan la partición por grupo de medida que almacena la diferencia (el delta) entre el valor de célula puesto al día y el valor original. Cuando una pregunta de MDX solicita datos de célula de este grupo de medida, el motor de almacenaje tiene acceso a todas las particiones incluyendo la partición contestaré y agrega los resultados para producir el valor de célula derecho. En el Servidor SQL 2005 y liberaciones más tempranas, Servicios de Análisis requeridos contestan particiones para tener el almacenaje ROLAP. Esto es una causa común para publicaciones de funcionamiento
Servicios de Análisis Reserva Realzada``Analysis Services Enhanced Backup’’En el Servidor SQL 2008 Servicios de Análisis R2 uno de los realces de funcionamiento que usted encontrará es un nuevo subsistema de almacenaje de reserva. El subsistema de almacenaje de reserva ahora ha sido vuelto a escribir para tener el funcionamiento mayor en cuenta y la adaptabilidad. Los cambios son transparentes a su uso - ningún cambio de código es necesario para aprovecharlos.  El nuevo subsistema de almacenaje de reserva había introducido un nuevo formato a los archivos de reserva de Servicios de Análisis. La extensión de nombre del archivo no se ha cambiado. Sin embargo, el formato interno es diferente, entonces la reserva puede escalar bien para manejar bases de datos sobre un terabyte en el tamaño. SQL el Servidor 2008 R2 la reserva de Servicios de Análisis es totalmente atrasado compatible con el Servidor SQL 2005 Servicios de Análisis. Esto le permite para restaurar bases de datos sostenidas en el Servidor SQL 2005.
Base de datos Escalable Compartida asScalable Shared Database for ASSQL el Servidor 2008 Servicios de Análisis R2 apoyan esto con un rasgo llamó la base de datos escalable compartida (SSD).  La escala hacia fuera puede aplicarse a varios argumentos y cargas de trabajo como el tratamiento, preguntas, datos y la dirección de escondrijo. La escala más común - hacia fuera el argumento para Servicios de Análisis debe extender la carga de pregunta a través de múltiples servidores en respuesta al número creciente de usuarios simultáneos. Esto ha sido alcanzado en el pasado por colocando una carga que equilibra la solución como la Carga de Red de Microsoft que Equilibra (NLB) la capacidad delante de múltiples servidores y reproduciendo de los datos físicos entre los servidores. La dirección de tal entorno plantea varios desafíos
La figura siguiente ilustra una configuración típica SSD.
Reportaje de Adaptabilidad``Reporting Scalability’’El Servidor SQL 2008 R2 el Reportaje de Servicios relatando el motor ha tenido una mejora principal de la liberación previa, de modo que esto pueda dar informes mucho más grandes que ello podría antes. Aunque esto no sea expresamente una mejora de almacenaje de datos (es útil en el reportaje operacional también), es útil en algunos argumentos de almacenaje de datos. Si usted crea informes con cientos o miles de páginas, SQL el Servidor 2008 R2 Relatando Servicios le ayuda a dar los informes más rápido. Además, el tamaño del informe más grande que puede ser dado ha sido aumentado dramáticamente, considerando la misma configuración de hardware.Adaptabilidad de Servidor SQL el Servidor 2008 R2 Relatando Servicios no corre dentro del Servidor de Información De Internet (IIS). Esto puede manejar su propia memoria, y tiene sus propios límites de memoria. Esto permite que usted para configurar los ajustes de memoria tan SSRS pueda correr sobre el mismo ordenador más con eficacia con otros servicios, como el Servidor SQL.
Preguntas de retroalimentaciónPara que nos sirve la característica  Partitioned Table Parallelism?Quees data warehouse?Para quenossirve la caracteristica Merge?Caracteristicas del regulador de recursos?Cuales son los obejtivos principales del regulador de recursos?

Más contenido relacionado

PPTX
Data werehousing
PPTX
SQL Server 2012 para No DBAs - Aspectos esenciales de SQL Server, parte 1
PPSX
Administracion de base de datos oracle tarea#02
PPT
Programacion con SQL Server 2005
PPTX
Mejores practicas sql
PDF
Introducción a SQL sobre Oracle
PDF
Lo que siempre has querido saber para exprimir sql server
PPTX
Desnormalizacion bases datos 2
Data werehousing
SQL Server 2012 para No DBAs - Aspectos esenciales de SQL Server, parte 1
Administracion de base de datos oracle tarea#02
Programacion con SQL Server 2005
Mejores practicas sql
Introducción a SQL sobre Oracle
Lo que siempre has querido saber para exprimir sql server
Desnormalizacion bases datos 2

La actualidad más candente (19)

ODP
Administración de Oracle - Tema 3 - Creación de la BD
PPT
Tablespaces En Oracle
PDF
Abf leccion 10
PPTX
Estructura de Almacenamiento en Oracle. TableSpaceZ052 07
PPTX
Introducción Procesador Consultas SQL Server - Query Processor
PPT
Desnormalizacion
ODP
Administración de Oracle - Tema 4 - Interacción con la Base de Datos
PDF
Copia de-mandante
PPT
Lenguaje transact
DOCX
PDF
arquitectura db de oracle 11g
PPSX
Administracion de Base de Datos Oracle
PDF
HERRAMIENTAS DE CONTROL DE MONITOREO Y ESTADISTICAS DE ACCESO A BASE DE DATOS...
PPTX
Arquitectura de Oracle 11g r2
PDF
Creacion de una base de datos
PPTX
Administrando SQL Server, mejores practicas para un DBA
PPTX
Cuadros de mando de BI con SQL Server
PPTX
Herramientas de control,monitoreoy estadistica de bd
Administración de Oracle - Tema 3 - Creación de la BD
Tablespaces En Oracle
Abf leccion 10
Estructura de Almacenamiento en Oracle. TableSpaceZ052 07
Introducción Procesador Consultas SQL Server - Query Processor
Desnormalizacion
Administración de Oracle - Tema 4 - Interacción con la Base de Datos
Copia de-mandante
Lenguaje transact
arquitectura db de oracle 11g
Administracion de Base de Datos Oracle
HERRAMIENTAS DE CONTROL DE MONITOREO Y ESTADISTICAS DE ACCESO A BASE DE DATOS...
Arquitectura de Oracle 11g r2
Creacion de una base de datos
Administrando SQL Server, mejores practicas para un DBA
Cuadros de mando de BI con SQL Server
Herramientas de control,monitoreoy estadistica de bd
Publicidad

Destacado (20)

PPTX
Necesidades Educativas Especiales
PDF
Cena Nochevieja en el Iberostar Grand Hotel Menceyy
DOCX
Infraextrucctura
DOC
PPTX
Presentacion power point pregunta 4 incorporacion de las nntt en el entorno d...
DOC
Cuestionario5
PDF
PPTX
VARIABLES QUE DETERMINAN LA DIVERSIDAD EN EL AULA
PDF
Grado en Ciencias Ambientales Universidad Alfonso X el Sabio
PPTX
Deber de equipos
DOCX
Exercicis amb programa de simulació neumàtic
PPT
Reto para los servicios de salud. Experiencia en brotes de Dengue y preparaci...
PPT
Vigilancia del chikungunya por laboratorio en Argentina (Victoria Luppo, INEVH)
PPTX
Técnicas de información comunicación y aprendizaje colaborativo y
PDF
Marco curricular Nacional 3ra versión
PDF
Manual culturademocráticayculturadejusticiaelectoral
PDF
20140814 implantacion 1_3_5
PDF
Declaración de Política Ambiental de la UAX
PPTX
Metodologia equipo
Necesidades Educativas Especiales
Cena Nochevieja en el Iberostar Grand Hotel Menceyy
Infraextrucctura
Presentacion power point pregunta 4 incorporacion de las nntt en el entorno d...
Cuestionario5
VARIABLES QUE DETERMINAN LA DIVERSIDAD EN EL AULA
Grado en Ciencias Ambientales Universidad Alfonso X el Sabio
Deber de equipos
Exercicis amb programa de simulació neumàtic
Reto para los servicios de salud. Experiencia en brotes de Dengue y preparaci...
Vigilancia del chikungunya por laboratorio en Argentina (Victoria Luppo, INEVH)
Técnicas de información comunicación y aprendizaje colaborativo y
Marco curricular Nacional 3ra versión
Manual culturademocráticayculturadejusticiaelectoral
20140814 implantacion 1_3_5
Declaración de Política Ambiental de la UAX
Metodologia equipo
Publicidad

Similar a Data warehouse (20)

PPTX
Data warehouse
PPTX
Data warehouse
PPTX
SQL avanzado
PPTX
Sql dinamico14042011
PPTX
Creación de base de datos
 
PPTX
Técnicas avanzadas de consultas con sql server 2014
PPTX
Vistazo a SQL Server 2016
DOCX
DOCX
PPTX
Business Intelligence en Azure
PPTX
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
ODP
Trabajo de informatica.pptx yusssyy
PPTX
Base D E Dat Os Pau
PPTX
Diseño de una base de datos
PPTX
Vistazo a lo nuevo en SQL Server 2016
ODT
trabajodeinformatica
PPTX
BASE DE DATOS EN SQL
PPTX
Diseño de una base de datos
PPTX
Diseño de una base de datos
PDF
guia-2.pdf
Data warehouse
Data warehouse
SQL avanzado
Sql dinamico14042011
Creación de base de datos
 
Técnicas avanzadas de consultas con sql server 2014
Vistazo a SQL Server 2016
Business Intelligence en Azure
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datos
Trabajo de informatica.pptx yusssyy
Base D E Dat Os Pau
Diseño de una base de datos
Vistazo a lo nuevo en SQL Server 2016
trabajodeinformatica
BASE DE DATOS EN SQL
Diseño de una base de datos
Diseño de una base de datos
guia-2.pdf

Último (20)

PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PDF
Manual del Gobierno Escolar -MINEDUC.pdf
PDF
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
PDF
CURRICULAR DE PRIMARIA santa ursula..pdf
PPTX
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
PDF
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PDF
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
PDF
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
PDF
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
PDF
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
PDF
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PDF
IPERC...................................
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
TALLER DE ESTADISTICA BASICA para principiantes y no tan basicos
PDF
Nadie puede salvarte excepto Tú - Madame Rouge Ccesa007.pdf
PDF
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
DOCX
PLANES DE área ciencias naturales y aplicadas
DOCX
Programa_Sintetico_Fase_4.docx 3° Y 4°..
Telos 127 Generacion Al fa Beta - fundaciontelefonica
Manual del Gobierno Escolar -MINEDUC.pdf
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
CURRICULAR DE PRIMARIA santa ursula..pdf
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
IPERC...................................
2.0 Introduccion a processing, y como obtenerlo
TALLER DE ESTADISTICA BASICA para principiantes y no tan basicos
Nadie puede salvarte excepto Tú - Madame Rouge Ccesa007.pdf
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
PLANES DE área ciencias naturales y aplicadas
Programa_Sintetico_Fase_4.docx 3° Y 4°..

Data warehouse

  • 1. BASE DE DATOSMaestro: Carlos Arturo Torres Gastelu“Data warehouse”Numero de Equipo: 5Integrantes: Elvira Lázaro Irving Yañez Flores Victor Hazel
  • 2. proporciona una plataforma de almacenamiento de datos completa y permite crear y gestionar su almacén de datos, con una perspectiva adaptable para lograr una mayor satisfacción a las organizaciones, ya que en esta nueva versión se mejoro la escalabilidad.Microsoft SQL server 2008 r2“DATA WAREHOUSE”
  • 3. Características de la escalabilidadcontiene avances importantes respecto a versiones anteriores, por lo que funciona mejor cuando se crea, gestiona y se consulta en los almacenes de datos de gran tamaño
  • 4. estrella de Ingreso “Star Join”Con modelados dimensionalmente los almacenes de datos, una gran parte de su carga de trabajo suele consistir en lo que se conoce como la estrella de consultas de unión.Estas consultas siguen un patrón común que se une a la tabla de hechos con una o varias tablas de dimensiones, Además,suelen expresar las condiciones de filtro contra las columnas sin clave de las tablas de dimensiones y realizar una agregación en una columna de la tabla de hechos.La nueva tecnología empleada se basa en filtros de mapa de bits, también conocidos como filtros Bloom , que permite a SQL Server para eliminar las filas que no pueden obtener la tabla de hechos.
  • 5. estrella de Ingreso “Star Join”Esto ahorra una considerable cantidad de tiempo de CPU en comparación con tecnologías de procesamiento de consultas que utilizan los productos de la competencia.La nueva estrella de optimización de combinación utiliza una serie de combinaciones hash.
  • 6. Ejecuta consultas y también reordena los mapas de bits durante la ejecución, poniendo la primera más prioritaria, de ahí la segunda más prioritaria, y así sucesivamente. Esto permite ahorrar más tiempo de CPU, porque una vez que una fila de una tabla llega a fallar, este checa de nuevo en el mapa de bits, y la fila se omite.El procesador de consultas en SQL Server aplica la optimización automática de consultas.
  • 7. Tabla de Particiones Paralela “Partitioned Table Parallelism”El paralelismo tabla particionada (PTP) ayuda a obtener el máximo poder del hardware donde aplicaciones de almacenamiento de datos suele reunir grandes cantidades de datos históricos en las tablas de hechos, que a menudo son divididas por la fecha. mejora el rendimiento de los planes de consultas en paralelo con las tablas de particiones mediante una mejor utilización de la capacidad de procesamiento del hardware existente
  • 8. Tabla de Particiones Paralela “Partitioned Table Parallelism”
  • 9. Tabla de Particiones Paralela “Partitioned Table Parallelism”La ejecución de Q1 y Q2 en SQL Server 2005 puede generar un comportamiento inesperado. La ejecución de Q1 y Q2 en SQL Server 2008 R2 resultados en una mejor utilización del hardware disponible, y por lo tanto un mejor rendimiento, así como el comportamiento más predecible.
  • 10. Alineados partición vistas indexadas “Partition-Aligned Indexed Views”Permiten crear y gestionar los agregados de resumen en su almacén de datos relacionales de manera más eficiente, y utilizarlos en situaciones en las que no podría usarlos con eficacia antes, la mejora de rendimiento de las consultas en un escenario típico, que tiene una tabla que se divide por la fecha, las vistas indizadas se definen en esta tabla para acelerar las consultas.En esta mejora significativa sobre SQL Server 2005, donde se debe quitar todas las vistas indizadas se define en una tabla con particiones antes de usar el funcionamiento del interruptor de ALTER TABLE para cambiar una partición en o fuera de ella. En SQL Server 2008 R2 ofrece las ventajas de las vistas indizadas en tablas con particiones grandes, evitando al mismo tiempo el costo de la reconstrucción de los agregados en toda una tabla con particiones. Estos beneficios incluyen el mantenimiento automático de los agregados
  • 11. Alineados partición vistas indexadas “Partition-Aligned Indexed Views”
  • 12. conjuntos de agrupación“GROUPING SETS”Permiten escribir una consulta que produce varias agrupaciones y devuelve un solo conjunto de resultados. El conjunto de resultados es equivalente a una UNION ALL de filas agrupadas de manera diferente. Permite escribir informes con varias agrupaciones con facilidad, con el rendimiento de las consultas mejorado.
  • 13. “MERGE”La instrucción MERGE le permite realizar varias manipulaciones de bases de datos, en una tabla o vista dentro de una sola instrucción.La tabla o vista de destino está unido a una fuente de datos y las operaciones de DML se realizan en los resultados de la unión.La instrucción MERGE tiene tres cláusulas WHEN, cada una de ellas le permite realizar una acción específica de DML en una fila determinada en el conjunto de resultados:WHEN MATCHED.- Por cada fila que existe tanto en el objetivo y la fuente, permite actualizar o eliminar la fila en la tabla de destino.WHEN TARGET.- Por cada fila que existe en el origen pero no en el de destino, permite insertar una fila en el blanco.WHEN SOURCE.- Por cada fila que existe en el destino pero no en la fuente,permite actualizar o eliminar la fila en la tabla de destino.
  • 14. “MERGE”En el contexto del almacenamiento de datos, la instrucción MERGE se utiliza para efectuar operaciones INSERT eficiente y operaciones de actualización de SlowlyChangingDimensions (SCD) y para mantener la tabla de hechos en varios escenarios comunes.La instrucción MERGE tiene mejores características pero en SQL Server 2008 R2 también incluye una extensión de gran alcance para la instrucción INSERT que permite que se consumen las filas devueltas por la cláusula OUTPUT de una instrucción INSERT, UPDATE, DELETE o MERGE.
  • 15. Captura de datos modificados “Change Data Capture”Proporciona un mecanismo eficaz para rastrear y recopilar datos de los cambios realizados en las tablas de usuario y le proporciona acceso a modificar los datos en un formato relacional fácil consumo. Normalmente, se utiliza en una base de datos operativos para capturar los cambios de movimiento posterior en el almacén de datos. Por lo tanto elimina la necesidad de utilizar métodos intrusivos, como desencadenadores de usuario, columnas de marca, etc.
  • 16. Captura de datos modificados “Change Data Capture”
  • 17. INSERTAR registros mínimamente“Minimally Logged INSERT”Cuando se escriben datos en una base de datos, se escriben en el disco dos veces: una para el registro, y otra vez en la propia base de datos.Sin embargo, es posible escribir los datos en el disco una sola vez, en algunos casos importantes que involucran la inserción de datos en las tablas existentes, lo que acelera los procesos de ETL de manera significativa. Consiste en el registro de sólo la información que se requiere para revertir la transacción.Mejora, el rendimiento de las grandes operaciones a gran escala INSERTAR al reducir el número de registros a ser escrito y la cantidad de espacio de registro necesario para completar la operación.
  • 18. Compresión de datos“Data Compression”reduce el tamaño de tablas, índices o un subconjunto de las particiones de almacenamiento para poder reducir los datos redundantes. SQL Server ofrece dos tipos de compresión:La compresión ROW.- permite el almacenamiento de tipos de longitud fija, en formato variable de almacenamiento.La compresión PAGE.- reduce al mínimo, el almacenamiento de datos redundantes en la página mediante el almacenamiento de patrones de bytes, que ocurren comúnmente en la páginay luego hacen referencia a estos valores en las columnas respectivas.
  • 19. Compresión de reserva de seguridad “Backup Compression”Reduce el tamaño de las copias de seguridad de SQL y ahorra en los medios de comunicación en disco para copias de seguridad de SQL. Esta reducción en el espacio y el tiempo a expensas de la utilización de ciclos de CPU.Pero se puede controlar la cantidad de CPU cuando es utilizado por las copias de seguridad utilizando el regulador de recursos.
  • 20. regulador de recursos“Resource Governor”Permite controlar la cantidad de recursos de la CPU y la memoria asignada a diferentes partes de su carga de trabajo de la base de datos relacional.Se puede utilizar para evitar consultas fuera de controly de reservar recursos para una parte importante de su carga de trabajo. Objetivos principalesMonitoring.- permite el seguimiento del consumo de recursos por grupo de solicitudes.Predictability.-Proporcionala ejecución previsible de las cargas de trabajo en un ambiente donde no hay contención de recursos.
  • 21. regulador de recursos“Resource Governor”Prioritization.- Habilita la priorización de las cargas de trabajo. Hay tres nuevos recursos que son importantes para la gobernación del recurso, grupos de carga de trabajo, fondos de recurso, clasificación (y clasificador de funciones definidas por el usuario) Grupo: Un grupo de carga de trabajo, o el grupo, son una categoría especificada de usuario de solicita lo que es similar según la clasificación gobierna que son aplicados a cada petición. El valor de un grupo está en la supervisión de conjunto de consumo de recurso y una política uniforme que es aplicada a todo solicita en un grupo. Un grupo define la política para sus miembros.
  • 22. Fondo: Un fondo de recurso, o el fondo, representan una parte de los recursos físicos del servidor. Dependiendo sus ajustes, un fondo puede tener un tamaño fijo (sus ajustes de uso de recurso mínimos y máximos son iguales el uno al otro) o tienen una parte que es compartida entre múltiples fondos (su mínimo es menos que su máximo eficaz). "Compartido" en este caso simplemente quiere decir que los recursos van al fondo que solicita los recursos primero. En la configuración de falta todos los recursos son compartidos, así manteniendo la compatibilidad atrasada con la política de 2005 de Servidor SQL.Clasificación: La clasificación es un juego de las reglas escritas por usuario que permiten al Gobernador de Recurso clasificar solicita en los grupos descritos antes. Es puesto en práctica por un escalar Despachan-SQL la función definida por usuario (UDF) que es designado como " un clasificador UDF " para el Gobernador de Recurso.
  • 23. Estos conceptos son ilustrados en la figura siguiente:
  • 24. Mejoras de Servicios de Integración``Integration Services Improvements’’Haciendo ETL para mover datos de sus sistemas operacionales en su depósito de datos puede ser una tarea intensiva de tiempo. Para hacer este proceso más rápido, SQL el Servidor 2008 Servicios de Integración R2 (SSIS) introducen dos rasgos de adaptabilidad importantes: funcionamiento de consulta mejorado y funcionamiento de tubería de transformación mejorado.Funcionamiento de consulta es el componente de Consulta en SSIS este corre más rápido, y es aún más fácil al programa que en el Servidor SQL 2005. Una consulta prueba si cada fila en una corriente de filas tiene una fila que hace juego en otro dataset. Una consulta se parece a una base de datos la operación de juntura.
  • 25. Funcionamiento de Tubería``Pipeline Performance’’En el Servidor SQL 2008 R2 SSIS, varios hilos puede trabajar juntos para hacer el trabajo que fuerzan un hilo solo a hacer por sí mismo en el Servidor SQL 2005 SSIS. Esto puede darle una aceleración de vario-pliegue en el funcionamiento ETL. En el Servidor SQL 2005 SSIS, el paralelismo de tubería son más de grano grueso. Cuando los usuarios tienen un paquete simple con uno o dos árboles de ejecución, hay sólo uno o dos procesadores usados, y el paquete no podría beneficiarse de una máquina de multiprocesador con más que unos procesadores. Incluso si los usuarios lógicamente hienden el flujo de datos por usando el multimolde, todos los caminos de salida de un multimolde pertenecen al mismo árbol de ejecución, y ellos son ejecutados en serie por el Servidor SQL 2005 SSIS la tarea de flujo de datos.
  • 26. La figura siguiente muestra como el Servidor realzado SQL 2008 R2 el paralelismo de tubería trabaja.
  • 27. Mejoras de Servicios de Análisis``Analysis Services Improvements’’SQL el Servidor 2008 Servicios de Análisis R2 (SSAS) dramáticamente mejoran la velocidad de pregunta con el nuevo cómputo de bloque, contestar, y rasgos de funcionamiento de base de datos escalables compartidos. La posibilidad de gestión también se mejora con la capacidad de sostener bases de datos mucho más grandes.MDX Pregunta Funcionamiento: Cómputo de Bloque El cómputo de bloque mejorado en el Servidor SQL 2008 R2 SSAS acelera la pregunta de MDX que procesa principalmente por hacer el trabajo solamente para los valores no nulos en un espacio de cubo. Ningún tiempo es gastado evaluando células nulas. La idea clave detrás del cómputo sub espacial es la mejor introducida por contrastándolo con una evaluación de célula-por-célula "ingenua" de un cálculo. Considere un cálculo Rolling Sum que suma las ventas para el año anterior y el año corriente, y una pregunta que solicita el Rolling Sum hacia 2005 para todos los productos.
  • 28. Pregunta y Contesta Funcionamiento``Query and Write-back Performance’’El funcionamiento de contesta las operaciones, y preguntas sobre contestan datos, es mejorado en el Servidor SQL 2008 Servicios de Análisis R2. La célula contesta en Servicios de Análisis es la capacidad para usuarios finales para poner al día valores de célula en la hoja o niveles agregados. La célula contesta los empleos un especial contestan la partición por grupo de medida que almacena la diferencia (el delta) entre el valor de célula puesto al día y el valor original. Cuando una pregunta de MDX solicita datos de célula de este grupo de medida, el motor de almacenaje tiene acceso a todas las particiones incluyendo la partición contestaré y agrega los resultados para producir el valor de célula derecho. En el Servidor SQL 2005 y liberaciones más tempranas, Servicios de Análisis requeridos contestan particiones para tener el almacenaje ROLAP. Esto es una causa común para publicaciones de funcionamiento
  • 29. Servicios de Análisis Reserva Realzada``Analysis Services Enhanced Backup’’En el Servidor SQL 2008 Servicios de Análisis R2 uno de los realces de funcionamiento que usted encontrará es un nuevo subsistema de almacenaje de reserva. El subsistema de almacenaje de reserva ahora ha sido vuelto a escribir para tener el funcionamiento mayor en cuenta y la adaptabilidad. Los cambios son transparentes a su uso - ningún cambio de código es necesario para aprovecharlos. El nuevo subsistema de almacenaje de reserva había introducido un nuevo formato a los archivos de reserva de Servicios de Análisis. La extensión de nombre del archivo no se ha cambiado. Sin embargo, el formato interno es diferente, entonces la reserva puede escalar bien para manejar bases de datos sobre un terabyte en el tamaño. SQL el Servidor 2008 R2 la reserva de Servicios de Análisis es totalmente atrasado compatible con el Servidor SQL 2005 Servicios de Análisis. Esto le permite para restaurar bases de datos sostenidas en el Servidor SQL 2005.
  • 30. Base de datos Escalable Compartida asScalable Shared Database for ASSQL el Servidor 2008 Servicios de Análisis R2 apoyan esto con un rasgo llamó la base de datos escalable compartida (SSD). La escala hacia fuera puede aplicarse a varios argumentos y cargas de trabajo como el tratamiento, preguntas, datos y la dirección de escondrijo. La escala más común - hacia fuera el argumento para Servicios de Análisis debe extender la carga de pregunta a través de múltiples servidores en respuesta al número creciente de usuarios simultáneos. Esto ha sido alcanzado en el pasado por colocando una carga que equilibra la solución como la Carga de Red de Microsoft que Equilibra (NLB) la capacidad delante de múltiples servidores y reproduciendo de los datos físicos entre los servidores. La dirección de tal entorno plantea varios desafíos
  • 31. La figura siguiente ilustra una configuración típica SSD.
  • 32. Reportaje de Adaptabilidad``Reporting Scalability’’El Servidor SQL 2008 R2 el Reportaje de Servicios relatando el motor ha tenido una mejora principal de la liberación previa, de modo que esto pueda dar informes mucho más grandes que ello podría antes. Aunque esto no sea expresamente una mejora de almacenaje de datos (es útil en el reportaje operacional también), es útil en algunos argumentos de almacenaje de datos. Si usted crea informes con cientos o miles de páginas, SQL el Servidor 2008 R2 Relatando Servicios le ayuda a dar los informes más rápido. Además, el tamaño del informe más grande que puede ser dado ha sido aumentado dramáticamente, considerando la misma configuración de hardware.Adaptabilidad de Servidor SQL el Servidor 2008 R2 Relatando Servicios no corre dentro del Servidor de Información De Internet (IIS). Esto puede manejar su propia memoria, y tiene sus propios límites de memoria. Esto permite que usted para configurar los ajustes de memoria tan SSRS pueda correr sobre el mismo ordenador más con eficacia con otros servicios, como el Servidor SQL.
  • 33. Preguntas de retroalimentaciónPara que nos sirve la característica Partitioned Table Parallelism?Quees data warehouse?Para quenossirve la caracteristica Merge?Caracteristicas del regulador de recursos?Cuales son los obejtivos principales del regulador de recursos?