Conceptos básicos

Business Intelligence con Power BI

Business Intelligence: Es la capacidad de transformar datos en información y a su vez, convertir esta información en conocimiento, para agilizar el tiempo en cuanto a la toma de decisiones

Flujo BI

  • ETL

    • Extracción de datos de fuentes de datos

    • Transformación de datos (consolidación de fuentes, limpieza y transformación de datos)

    • Carga de datos en el data Warehouse de Power BI

    • Herramientas: PowerCenter, SQL Server Integration Services (SSIS), Oracle Data Integrator (ODI), Power Query (en Power BI)

  • Modelado

    • Relaciones

    • KPI´s

    • Optimización (para responder a todas las preguntas de negocio)

    • Herramientas: Erwin Data Modeler, PowerDesigner (herramienta de modelado SAP), Power Pivot (en Power BI)

      • Data Warehouse: Suele servir como la base de datos central de una empresa o, en otras palabras, la base de datos donde se almacenan todos los datos útiles de una organización

      • Data Mart: Almacena datasets específicos y concisos utilizados para el análisis de un departamento o línea de negocio específicos, como el departamento de ventas

  • Informe (puesta en funcionamiento):

    • Visualización de datos

    • Informes

    • Dashboards

    • Storytelling

    • Herramientas: Power BI, Qlik, Tableau, etc.

      • Dashboard: Un dashboard es una herramienta empresarial usada para ayudar a rastrear, analizar y mostrar datos, generalmente para obtener una visión más profunda del estado general de la organización, de un departamento o incluso de un proceso específico. En Power BI, corresponde al informe

      • Balanced scorecard: Es una herramienta para monitorear las decisiones estratégicas que toma la empresa con base en indicadores previamente establecidos y que normalmente deben permear por lo menos cuatro aspectos – financiero, clientes, procesos internos y aprendizaje y crecimiento -. En Power BI, corresponde al dashboard

Power BI: Es una solución de Business Intelligence integral y completa que brinda una vista detallada de los datos más críticos dentro de una organización

Suite empresarial

  • Power BI Desktop: Herramienta de escritorio orientada al entorno de desarrollo, que nos permite conectarnos a diversas fuentes de datos y generar informes

  • Power BI Service: Servicio en la nube que nos permite establecer todo el entorno colaborativo

  • Power BI Mobile: Aplicación móvil que nos permite ver e interactuar con un reporte desde cualquier dispositivo móvil (Android y Apple)

Componentes de Power BI

  • Power Query ETL: Extracción, transformación y carga de datos

  • Modelado Power Pivot (DAX): Responde todas las preguntas empresariales

Arquitectura de Power BI

Arquitectura de Power BI gratis

  • Incluye 1 GB de almacenamiento

  • No es posible colaborar con otros usuarios simultáneamente (informes, dashboards y dataset), pero es posible publicar en sitios web (sin seguridad)

  • El intercambio de informes solo es posible en modo público (sin seguridad)

Arquitectura Power BI PRO

  • Incluye 10 GB de almacenamiento

  • Se puede compartir con usuarios internos siempre que también tengan una licencia PRO

  • Gateway opcional

  • Puede actualizar datos hasta 8 veces al día

  • El creador (en Desktop) y el usuario (en Service) deben tener, cada uno, una licencia

Arquitectura Power BI PREMIUM

  • Incluye 100 TB de almacenamiento

  • Se puede compartir con usuarios internos sin necesidad de que tengan Power BI PRO

  • Mayor escalabilidad y rendimiento que la capacidad compartida en el servicio Power BI

  • Puede actualizar datos hasta 48 veces al día

  • El creador (en Desktop) y el usuario (en Service) deben tener, cada uno, una licencia

Aviso: Nada de esto se puede iniciar con una cuenta de correo electrónico personal, sino solo con una cuenta de correo electrónico empresarial o educativa

Tipos de conexión

Tipos de conexiones

Power BI nos permite conectarnos a una amplia variedad de fuentes de datos, desde archivos de Excel, bases de datos de SQL Server, sitios web, etc.

Tipos de conexión

  • Live Connection o dinámica: lea desde SSAS o desde un dataset del servicio Power BI, en otras palabras, los datos se almacenan fuera de Power BI (como en DirectQuery)

  • DirectQuery: No se copian los datos, ya que cada interacción hace una consulta a la base de datos

  • Importación: Los datos se copian localmente dentro del modelo de Power BI (este es el modelo más común)

  • Modelos Compuestos: Combinan tecnologías de Importación y DirectQuery. También permite usar múltiples datasets

Live Connection

DirectQuery

Importar

Compuesto

para soluciones empresariales

informe completo

informe completo

combina DQ e Importación

no hay datos almacenados en la memoria

no hay datos almacenados en la memoria

no hay datos almacenados en la memoria

mayores volúmenes de datos

informe completo

sin transformación de datos

transformación completa de datos

sin servicios de análisis

sin transformación de datos

modelado de datos limitado

modelado completo de datos

sin modelado de datos

bajo rendimiento

de alto rendimiento

de alto rendimiento

datos almacenados en la fuente

datos almacenados en Power BI

datos almacenados en la fuente

consultas enviadas a la fuente

consultas no enviadas a la fuente

consultas enviadas a la fuente

no se requiere actualización

actualización requerida

no se requiere actualización

admite preguntas y respuestas e información rápida

fuente de datos

componente almacenado en la fuente de datos

componente almacenado en Power BI

Avisos:

  • Con conectividad de Importación, el archivo PBIX y el dataset son alojados en la memoria, es el más rápido de todos los tipos de conectividad, pero el dataset de Power BI debe programarse para actualizarse, y siempre debemos tener en cuenta el uso de la memoria. Con licencias PRO, el dataset de Power BI no puede exceder 1 GB, sin embargo, con Power BI PREMIUM esto puede alcanzar niveles de 400 GB

  • Con conectividad DirectQuery no se alimenta ni almacena ningún dato en el modelo de Power BI. Power BI solo almacenará los metadatos de los datos subyacentes, por lo tanto, los nombres de las tablas, las relaciones, los nombres de los campos, etc., pero no los datos actuales. Al no almacenar ningún dato en el modelo de Power BI, significa que podemos almacenar mayores volúmenes de datos y hay menos posibilidades de que encontremos alguna de las limitaciones de volumen de datos en el dataset de Power BI, como el dataset de 1 GB que viene con la licencia PRO. DirectQuery solo está disponible con fuentes de bases de datos

En este modelo de conectividad, las consultas se generarán y enviarán directamente a la fuente de datos subyacente para solicitar datos antes de mostrarlos. Los datos permanecen en el lado de la fuente, están disponibles casi en tiempo real y no se requiere una actualización programada, pero puede tener un impacto en los consumidores de informes y en el rendimiento de la fuente de datos subyacente cuando demasiados usuarios generan consultas al mismo tiempo. Power BI tiene algunos métodos de reducción de consultas para reducir el número de consultas al origen

El uso de DirectQuery limita las capacidades de Power BI Desktop. Por ejemplo, las funciones DAX de inteligencia de tiempo, como el mismo período del año pasado, no están disponibles con el fin de limitar la complejidad de las consultas enviadas a la fuente de datos subyacente y algunas transformaciones en Power Query están restringidas, como eliminar duplicados y cambio a algunos tipos de datos. Además, Power BI solo permite que DirectQuery devuelva 1 millón de filas del origen de datos subyacente a menos que usemos Power BI PREMIUM

  • Es muy común encontrar que LiveConnection se confunde con DirectQuery debido a que ambos tipos de conectividad no almacenan ningún dato en el modelo de Power BI. Sin embargo, son dos tipos de conectividad muy diferentes y no se pueden usar indistintamente. El uso de LiveConnection significa que no se almacenan datos en el modelo de Power BI, por lo que toda interacción con un informe mediante LiveConnection consultará directamente el modelo de Analysis Services existente

LiveConnection se puede emplear con SQL Server Analysis Services (modelos tabulares y cubos multidimensionales), Azure Analysis Services (modelos tabulares) y datasets de Power BI alojados en el servicio Power BI. Como estas fuentes son motores analíticos, el rendimiento general será mucho mayor en comparación con DirectQuery. Además, todas estas fuentes pueden ofrecer una capa semántica que actúa como una versión única de la verdad, ofreciendo a la empresa una capa dorada de datos bien gobernados y de alta integridad, por lo tanto, se utiliza comúnmente en implementaciones empresariales de Power BI, pero solo con las fuentes de datos nombradas

El uso de LiveConnection tiene algunas restricciones desde la perspectiva de la creación. Sin embargo, como todo el trabajo se ha realizado en Analysis Services o en un dataset de Power BI existente, simplemente estamos aprovechando un modelo de nivel empresarial existente, por lo que tiene sentido que existan restricciones en las capacidades de transformación y modelado de datos. Además, existen algunas limitaciones en las medidas DAX que se pueden escribir, ya que únicamente las medidas de nivel de informe están disponibles en él. Esto significa que las medidas se almacenan en el informe de Power BI y no se vuelven a escribir en el modelo de Analysis Services. Todas las capacidades de generación de informes están disponibles para su uso

Una LiveConnection establece una conexión a una capa semántica como Analysis Services o un dataset de Power BI. En un escenario empresarial, es importante tener una capa semántica ubicada entre sus sistemas de origen de datos y Power BI, ya que simplifica los datos en el data Warehouse al hacerlos más utilizables para la empresa. Además, alinea datos complejos con términos comerciales familiares y elimina la necesidad de realizar cualquier preparación de datos, por lo que ofrece una vista completa y consolidada en toda la organización

  • Con los modelos de conectividad Compuestos, podemos combinar datos de varias fuentes de datos de DirectQuery y mezclar datos de una fuente de datos de importación. Por ejemplo, podemos establecer una conexión DirectQuery a la tabla de hechos de ventas y varias tablas de dimensiones desde un data Warehouse SQL e ingerir datos mediante una importación desde una hoja de cálculo de Excel que contiene valores de presupuesto. En la aplicación Power BI Desktop, notará que el modo de almacenamiento está configurado en Compuesto en la parte inferior derecha, como se muestra a continuación

Tiene la capacidad de alimentarse de datos adicionales en su informe de Power BI que no existen en nuestro data Warehouse SQL. Es muy común usar DirectQuery para un data Warehouse SQL, para datos casi en tiempo real y para manejar grandes volúmenes de datos; sin embargo, también es muy común que un único dataset no esté disponible en el data Warehouse empresarial, como los valores del presupuesto. Es posible que el equipo de BI no tenga la capacidad y los recursos para incorporar estos datos en el data Warehouse. Sin el modelo de conectividad compuesto, la forma de evitar esto podría haber sido simplemente importar todos los datos del data Warehouse

Debemos tener en cuenta que el uso de un modelo de conectividad compuesto limita algunas capacidades disponibles en Power BI, de la misma manera que lo hace un solo DirectQuery. No se han eliminado todas las limitaciones que actualmente vienen con DirectQuery. Por lo tanto, las tablas en el informe de Power BI que tienen una DirectQuery a la fuente todavía tienen limitaciones en torno a las funciones DAX de Time-Intelligence y muchas de las transformaciones de datos en Power Query

Last updated