Diseño de un data warehouse: Slowly changing dimensions
26 Diciembre 2007
3 comentarios
Para estas fiestas señaladas, volvemos a nuestro tema recurrente: diseño de un data warehouse. Llegados a este punto es necesario hablar de Slowly Changing Dimensions (SCD). Este concepto aplica a como una dimensión debe tener en cuenta los cambios históricos. Respecto este punto de vista las dimensiones se pueden clasificar como:
- Tipo 0 (SCD): No se tiene en cuenta la gestión de los cambios históricos y no se realiza esfuerzo alguno. De manera que alguna información será sobreescrita, pero otra no. Sin planificación alguna.
- Tipo 1 (SCD): No se guardan históricos. La nueva información sobreescribe la antigua siempre. Principalmente la sobreescritura se realiza por errores de calidad de datos. Este tipo de dimensiones es fácil mantener y son usadas cuando la información histórica no es importante.
- Tipo 2 (SCD): Toda la información histórica se guarda en el data warehouse. Cuando hay un cambio se crea una nueva entrada con su fecha y surrogate key apropiadas. A partir de ese momento será el valor usado para las futuras entradas. Las antiguas usaran el valor anterior.
- Tipo 3 (SCD): Toda la información histórica se guarda en el data warehouse. En este caso se crean nuevas columnas con los valores antiguos y los actuales son remplazados con los nuevos.
Es conveniente comentar que algunas dimensiones pueden crecer desmesuradamente. Una buena práctica es romper la dimensión en dos tablas: una que contenga los valores estáticos o otra que contenga los valores volátiles.

