2. EXPERTO EN POWER BI
Módulo I: Importar, transformar y cargar datos
Sesión 4: Power BI, Modelamiento de Datos
DAX & Power BI
3. TEMARIO DE LA SESIÓN
¿Qué es un modelo de datos?
Importancia de contar con un modelo de datos
Entidades y relaciones
Modelo relacional
Claves (llave)
Pasos para la creación del modelo
Administración de relaciones
4. ¿Qué es un modelo de datos?
Organiza los elementos de un conjunto de datos
y estandariza las relaciones entre ellos.
Es una manera de estructurar y organizar los
datos para que se puedan utilizar fácilmente por
las bases de datos.
El modelo de datos se utiliza habitualmente en
combinación con un sistema de gestión de base
de datos.
5. Ejemplo:
El negocio de venta de frutas
está compuesto de los
VENDEDORES, las VENTAS
efectivas, los PRODUCTOS a
vender y los GRUPOS o tipos
de PRODUCTOS.
Estos componentes se
vinculan mediante el modelo
relacional que termina de
definir el negocio.
31. TEMARIO DE LA SESIÓN
Construir relaciones
Tablas de dimensiones, hechos y relaciones
Categoría de datos
32. Construir relaciones
Características de las relaciones, a las cuales debe prestar atención:
▪ Relaciones auto detectadas.
▪ Solo debe haber una relación activa entre dos tablas.
▪ Pueden existir un número ilimitado de relaciones inactivas entre dos
tablas.
▪ Las relaciones deben construirse sobre una sola columna.
▪ Las relaciones no se pueden construir directamente entre tablas que
tienen un relación muchos a muchos.
▪ Las relaciones filtran de manera automática de un lado de la relación
al lado de muchos.
33. Abrir el archivo Sesión 04 - Building the Data Model.pbix. Observe las
relaciones ya construidas en dicho modelo.
34. Relación, la línea entre dos tablas
representa la relación que existe.
Dirección, la flecha indica en que
dirección ocurrirá el filtrado.
Un lado (UNO), el número 1
indica que la tabla DATE se
encuentra a un lado de la
relación.
Muchos, el * indica que la tabla
Internet Sales se encuentra en el
lado de MUCHOS.
1
2
3
4
1
2
3
4
35. Lo primero que debe
realizar al momento
de importar datos a
Power BI, es verificar
si las relaciones auto
detectadas son las
correctas. Ir a
Administrar relaciones.
38. Observe en la siguiente gráfica
Matriz, el monto total de la Venta
Sales Amount.
Luego añada el campo Sales Territory
Country, observar que el filtrado
funciona por que existe una relación
valida.
39. Observar en cambio que si se
agrega un campo Temperatura
Range de una tabla no relacionada,
los datos no se propagan
adecuadamente en la matriz.
40. Tabla de dimensiones, hechos y relaciones
Conectarse al archivo
Sesión 04 - Base de
Pedidos.xlsx, y seleccionar
las siguientes tablas.
41. Una tabla de dimensiones es una tabla o entidad de un esquema de
estrella, copo de nieve o constelación que almacena detalles acerca de
hechos. Almacena información descriptiva sobre los valores numéricos
de una tabla de hechos. Por ejemplo, las tablas de dimensiones para
una aplicación de análisis de mercado pueden incluir el tipo de período
de tiempo, región comercial y producto, describen los distintos
aspectos de un proceso de negocio.
Crear los grupos Previo
y Modelo de Datos y
organizar las tablas
según muestra.
42. Combinar la tabla
producto y categoría, a
través del campo
IDCategoría.
La consulta resultante
moverla al grupo
Modelo de Datos.
43. Renombrar la tabla consolidada a
Productos, y en dicha tabla
expandir solo el Nombre de la
categoría del producto.
44. Deshabilitar la carga de
las tablas en el grupo
Previo, y proceder a
Cerrar y aplicar.
Observar que las tablas
se hayan cargado
correctamente.
Ir a vista Modelo,
observar las tablas de
dimensiones.
47. Renombrar la tabla combinada resultante a TablaHechos Pedidos y
proceder a expandir los campos IdCliente, IdEmpleado, FechaPedido,
FechaEntrega, FechaEnvío, FormaEnvío.
49. Deshabilitar la carga de
las tablas en el grupo
Previo, y proceder a
Cerrar y aplicar.
Ir a vista Modelo, observar las tablas de
dimensiones. Eliminar las relaciones que
se hayan creado de manera automática.
50. Relaciones en el modelo de datos
Entonces un MODELO DE
DATOS, es un conjunto de
tablas, unidas por
relaciones.
51. Administrar relaciones
Teniendo como base el Modelo de datos, el analista de datos podrá realizar los
análisis respectivos así como los Dashboards que requiera el negocio.
52. Categoría de datos
Power BI realizar algunas suposiciones sobre las
columnas de las tablas basada en el tipo de dato
configurado. Estas suposiciones son empleadas
por defecto cuando se construyen las
visualizaciones.
La clasificación de los datos puede mejorar la
experiencia del usuario así como la precisión,
especialmente usada en datos geográficos.
Existen 13 posibilidades de categorizar los datos.
54. Categoría de datos
Seleccionar en la
tabla Sales Territory
el campo o
columna Sales
Territory Country y
en categoría de
datos País o región.
55. TEMARIO DE LA SESIÓN
Introducción a DAX
Generación de tablas DAX
Generación de columnas DAX
Generación de medidas DAX
Generación de jerarquías en modelos de datos
56. ¿QUÉ ES DAX?
▪ DAX es un lenguaje de programación de POWER BI.
▪ Se puede entender como un conjunto de expresiones para realizar diversos
análisis de datos.
▪ Es un lenguaje de programación funcional, esto quiere decir que usa funciones
como suma, promedio y similares que veremos más adelante.
▪ DAX es un lenguaje de programación de MS SQL (SaaS) y Microsoft Power Pivot
para Excel, lanzado el 2010.
▪ El lenguaje DAX fue creado específicamente para el manejo de modelos de
datos. DAX es usado en diferentes productos de Microsoft, como Power BI,
Microsoft Analysis Services y Microsoft Power Pivot para Excel, todos estos
productos comparte el mismo motor interno.
▪ DAX: Data Analysis Expressions
57. Introducción a DAX
DAX trabaja con tablas, por lo que todas las fórmulas se referencian a
columnas. Se requiere referenciar la tabla, ya que un modelo de datos
puede contener varias tablas y cada tabla con diferentes columnas, las
que podrían tener un mismo nombre.
Ventas[ImporteVenta]=Ventas[PrecioProducto] * Ventas[CantidadUnidades]
58. TIPOS DE DATOS EN DAX
DAX está basado en
tablas, las tablas están
conformadas por columnas
y las columnas hacen
referencia a un tipo de
dato específico.
Es importante conocer el
tipo de datos de los
parámetros que se usan
en una función ya que se
presentarán casos en
que las funcionen no
trabajen.
Existen:
- Datos numéricos
- Las fechas
- Texto
- Lógico (SI / NO)
POWER BI intenta realizar
conversiones automáticas
para que funcionen las
fórmulas. Respecto a eso:
Nunca confíe en las
conversiones
automáticas.
59. FUNCIONES RELEVANTES EN DAX - Números
A continuación observamos las siguientes funciones de vital
importancia en DAX.
1 FUNCIÓN SUMA (SUM): Suma todos los números en una columna.
Sintaxis: SUM(<columna>)
2
FUNCIÓN PRODUCTO (PRODUCT): Devuelve el producto de los
números en una columna.
Sintaxis: PRODUCT(<columna>)
3
FUNCIÓN DIVIDIR (DIVIDE): Devuelve la división entre dos
números y un valor alternativo cuando se divide por cero.
Sintaxis: DIVIDE(<numerador>, <denominador>, [;<resultado_alternativo>])
60. FUNCIONES RELEVANTES EN DAX - Números
4
FUNCIÓN REDONDEAR (ROUND): Redondea un número a un
número especificado de dígitos.
Sintaxis: ROUND(<número>, <número_de_digitos>)
5
FUNCIÓN TRUNCAR (TRUNC): Trunca un número volviéndolo
entero, remueve su parte decimal o una parte de él.
Sintaxis: TRUNC(<número>, <número_de_digitos>)
61. FUNCIONES RELEVANTES EN DAX – Operaciones
Lógicas
1
FUNCIÓN Y (AND): Revisa si ambos parámetros son verdaderos y
devuelve verdadero, en los demás casos devuelve falso.
Sintaxis: AND(<parámetro1>, <parámetro2>)
2
FUNCIÓN O (OR): Revisa si al menos uno de los argumentos es
verdadero para devolver verdadero, en el caso de que ambos sean
falsos, devuelve falso.
Sintaxis: OR (<parámetro1>, <parámetro2>)
62. FUNCIONES RELEVANTES EN DAX – Operaciones
Lógicas
1
FUNCIÓN SI (IF): Revisa si una condición que es obtenida del
primer parámetro se cumple, en base a esto devuelve un valor
determinado si es verdadero u otro si es falso.
Sintaxis: IF(<prueba_lógica>, <valor_si_verdadero>, , <valor_si_falso>)
2
FUNCIÓN SIERROR (IFERROR): Devuelve la expresión o un valor
alternativo en cas de que se obtenga error.
Sintaxis: IFERROR (<expresión>, <valor_alternativo_si_error>)
69. Generación de columna DAX
Aplicar función RELATED en la tabla Producto, para traer los campos de
ProductoSubcategoria, ProductoCategoria.
70. La función RELATED requiere que exista una relación entre la tabla actual
y la tabla con la información relacionada.
Se recomienda realizar todo lo correspondiente a transformar datos en el
Power Query, mientras que en Power BI se recomienda trabajar con
medidas para optimizar el uso de memoria.
71. Cambiar el formato de fecha y hora, del campo FechaVenta en la tabla
Ventas.
73. Generación de medidas DAX
Con las medidas, puede crear algunas de las
soluciones de análisis de datos más eficaces
en Power BI Desktop. Las medidas ayudan al
realizar cálculos con los datos a medida que
se interactúa con los informes.
Les medidas permiten optimizar memoria
cuando se opera sobre un modelo de datos.
74. Generación de medidas DAX
Dar un clic en Especificar datos y dar nombre a la tabla como
Medidas.
Observar que la tabla Medidas se carga al modelo.
75. Generación de medidas DAX
Dar un clic en Nueva medida y crear las medidas que se
indican.
76. Generación de medidas DAX
Observar en el modelo de datos,
que la tabla medidas cuenta con
las medidas creadas.
Emplear las medidas en un
gráfico tipo Tabla.