Cómo no construir un datawarehouse
Serie DWH
A través de TodoBI he encontrado un artículo muy interesante de Ralph Kimball (¿Algún despistado que no lo conoce?) donde detalla los 12 errores más comunes en la construcción de un datawarehouse.
Se trata de un artículo excelente . Cada vez que he cometido alguno de estos errores, he tenido que rectificar al poco tiempo. No valen los atajos, hay que hacer las cosas bien desde el principio.
Los doce errores más comunes en la construcción de un datawarehouse son:
- Error 12 : Incluir atributos de texto en una tabla de hechos, si se hace con la intención de filtrar o agrupar.
- Error 11 : Abreviar las descripciones en las tablas de dimensión con la intención de reducir el espacio requerido.
- Error 10 : Dividir las jerarquías y los niveles de las jerarquías en múltiples dimensiones.
- Error 9 : No afrontar el tratamiento de las dimensiones lentamente cambiantes.
- Error 8 : Crear “smart keys” para relacionar una tabla de dimension con una tabla de hechos.
- Error 7 : Añadir dimensiones en una tabla de hechos antes de definir su granularidad.
- Error 6 : Crear un modelo dimensional para resolver un informe en particular.
- Error 5 : Mezclar hechos de diferente granularidad en una misma tabla de hechos.
- Error 4 : Olvidarse del máximo nivel de detalle en el modelo entidad-relación.
- Error 3 : Omitir las tablas agregadas y comprimir las tablas de dimension para afrontar los problemas de rendimiento.
- Error 2 : No unificar los hechos entre distintas tablas de hechos
- Error 1 : No compartir dimensiones entre diferentes tablas de hechos.
En mi vida laboral he participado en la construcción de varios datawarehouses, y he visto muchos de estos errores. Durante los próximos días, analizaré una a una estas recomendaciones de Kimball, e intentaré justificar por que son errores graves y cómo debemos evitarlos.
A mis lectores menos "tekies", os pido perdón porque los próximos mensajes no los escribo pensando en vosotros. Van dirigidos al lado oscuro... :-)