Serie sobre cómo construir un datawarehouse
Serie DWHviernes, 19 de junio de 2009
Finalmente, he terminado de recorrer la lista de Ralph Kimball sobre cómo no construir un datawarehouse. A lo largo de estos artículos he intentado introducir los conceptos más importantes relativos a la modelización de un datawarehouse (base de cualquier entorno Business Intelligence).
Para finalizar esta serie, incluyo el índice de todas las entradas:
- Introducción: Cómo no construir un datawarehouse
- Artículo 1: Datawarehouse
- Artículo 2: Dimensiones
- Artículo 3: Jerarquías
- Artículo 4: Dimensiones lentamente cambiantes
- Artículo 5: Claves subrogadas
- Artículo 6: Tablas de hecho
- Artículo 7: DWH organizado por temas
- Artículo 8: Tablas agregadas
- Artículo 9: Máximo nivel de detalle
- Artículo 10: Rendimiento
- Artículo 11: Unificar los hechos
- Artículo 12: Unificar las dimensiones
Cada artículo, analiza uno de los 12 errores que justificaron esta serie:
- Mistake 12: Place text attributes in a fact table if you mean to use them as the basis of constraining and grouping.
- Mistake 11: Limit the use of verbose descriptive attributes in dimensions to save space.
- Mistake 10: Split hierarchies and hierarchy levels into multiple dimensions.
- Mistake 9: Delay dealing with a slowly changing dimension (SCD).
- Mistake 8: Use smart keys to join a dimension table to a fact table.
- Mistake 7: Add dimensions to a fact table before declaring its grain.
- Mistake 6: Declare that a dimensional model is "based on a specific report."
- Mistake 5: Mix facts of differing grain in the same fact table.
- Mistake 4: Leave lowest-level atomic data in E/R format.
- Mistake 3: Eschew aggregate fact tables and shrunken dimension tables when faced with query performance concerns
- Mistake 2: Fail to conform facts across separate fact tables.
- Mistake 1: Fail to conform dimensions across separate fact tables.
Y que traduje de esta manera...
- Error 12: Incluir atributos de texto en una tabla de hechos, si se hace con la intención de filtrar o agrupar.
- Error 11: Abreviar las descripciones en las tablas de dimensión con la intención de reducir el espacio requerido.
- Error 10: Dividir las jerarquías y los niveles de las jerarquías en múltiples dimensiones.
- Error 9: No afrontar el tratamiento de las dimensiones lentamente cambiantes.
- Error 8: Crear "smart keys" para relacionar una tabla de dimension con una tabla de hechos.
- Error 7: Añadir dimensiones en una tabla de hechos antes de definir su granularidad.
- Error 6: Crear un modelo dimensional para resolver un informe en particular.
- Error 5: Mezclar hechos de diferente granularidad en una misma tabla de hechos.
- Error 4: Olvidarse del máximo nivel de detalle en el modelo entidad-relación.
- Error 3: Omitir las tablas agregadas y comprimir las tablas de dimension para afrontar los problemas de rendimiento.
- Error 2: No unificar los hechos entre distintas tablas de hechos
- Error 1: No compartir dimensiones entre diferentes tablas de hechos.