A razón de tener de volver a explicar conceptos, se produce la consolidación de los mismos. Hoy volvemos un poco a la parte didáctica del blog.
El concepto de metadatos es uno de los más importantes a considerar en el marco de implementación de un sistema de Business Intelligence. Es entonces conveniente empezar una definición. Una primera definición sería como sigue: entendemos metadatos como datos sobre datos.
Como os podeis imaginar, esta definición puede inducir a la confusión de lo simple que es. Volvamos a intentarlo:
Datos estructurados y codificados que describen características de instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias descritas.
Esta segunda definición nos lleva al otro punto. Demasiado rebuscado. Pero ajustado. Entonces quizás lo interesante sea presentar un ejemplo antes de continuar.
Imaginad que habeis hecho una fotografía en la boda de un amigo con vuestra flamante cámara digital. La fotografia, una vez guardada en el disco duro de nuestro ordenador, es el dato. Si nos fijamos en las propiedades, hay toda una colección de datos asociados a la fotografía: el nombre, la fecha, el formato, el propietario,… (y algunos de ellos ya son añadidos automáticamente por nuestra camara). Ese tipo de información son metadatos. Es decir, información sobre un objeto que le proporcionan un valor añadido.
Esperemos que este ejemplo, haya clarificado el concepto.
Volvamos ahora a nuestro contexto.
En el área del Business Intelligence y en el proceso de Data Warehousing, tenemos que los metadatos deviene cruciales para proporcionar un valor añadido a los datos con lo que trabajamos.
Según Kimbal, respecto el proceso de data warehousing existen los siguientes tipos de metadatos:
- Source system metadata: incluye información como especificaciones (repositorios, schemas, permisos, disponibilidad,…) y descripción del sistema de origen (quién o qué poseé la información, frecuencia de actualización de la inforamción, LOPD, métodos de acceso,…) e información sobre procesos (procesos ETL, periodicidad de carga,…).
- Data staging metadata: esta categoría incluye diversos tipos como data acquisition management (información relativa a los resultados de los procesos ETL e uso de disco duro), dimension tabla management (definición de dimensiones y surrogate keys), transformation and documentation (mapeos de datos, enriquecimiento de la información, definciones de tablas afgregadas,…) y DBMS metadata (contenidos del data warehouse o data mart -schemas, permisos-, procesos de la base de datos,…).
Los metadatos del Business Intelligence engloban información respecto a los elementos de análisis que incluye la solución:
- OLAP metadata: descripción y estrucutra de los cubos, dimensiones, medidas, jerarquías, niveles,…
- Reporting metadata: descripción y estructura de los informes, gráficos, consultas, conjuntos de datos, filtros, variables y expresiones,…
- Data Mining metadata: descripción y estructuras de los dataSets, algoritmos y consultas,…
La existencia de una capa de metadatos incide en:
- Independencia de la estructura del data warehouse.
- Independencia de los usuarios del departamento IT.
- Enriquecer de forma fácil la información.
- Creación de vistas de negocio acordes con los usuarios.
Ahora debemos preguntarnos: ¿estamos dando la importancia a los metadatos en nuestra implementación de Business Intelligence?
Archivado bajo:BI, Business Intelligence, DW, Data Warehouse, Metadatos, Teoría , BI, Business Intelligence, Data Warehouse, DW, Metadatos
Sí, la metadata es importante durante el proceso de desarrollo, pero creo que adquiere mayor importancia cuando el sistema está en producción ya que la capa de negocio de metadata permite transmitir a los usuarios lo que están viendo en sus soluciones de BI.
Saludos,