Data Warehouse
Data Warehouse (DW) consiste em um sistema para armazenamento de dados originados de múltiplas fontes, especialmente estruturados para consulta e análise. Um DW busca a criação de uma fonte de dados padronizada, confiável e de acesso simplificado (Kimball e Ross, 2013).
Existem diversas abordagens para a construção de Data Warehouses. Kimball e Ross (2013) propõem uma abordagem de construção de um DW que integre toda a organização (Enterprise Data Warehouse - EDW). De acordo com os autores, a construção deste tipo de DW é fundamental para a governança de dados. Ainda de acordo com Kimball e Ross (2013), a ausência de um DW institucional como plataforma de BI, alinhado à uma boa governança de dados, leva à perpetuação de silos de dados similares entre departamentos, mas com versões da verdade ligeiramente diferentes.
O EDW é construído com a técnica denominada Modelagem Dimensional, que, segundo Kimball e Ross (2013), trata-se de uma abordagem amplamente aceita para consolidação de dados analíticos por abordar dois requisitos de forma simultânea:
-
- Apresenta dados em formatos entendíveis por usuários de negócio;
- Organiza os dados de modo a otimizar o desempenho de consulta.
Kimball e Ross (2013) mencionam ainda as seguintes técnicas existentes para a construção de Data Warehouses:
-
- Independent Data Mart Architecture;
- Hub-and-Spoke Corporate Information Factory Inmon Architecture;
- Hybrid Hub-and-Spoke and Kimball Architecture.
Kimball e Ross (2013) demonstram que as abordagens mencionadas acima possuem grandes desvantagens em comparação à abordagem de EDW com Modelagem Dimensional. Para mais detalhes sobre essas desvantagens consulte as páginas 26, 27, 28, 29 e 30 (KIMBALL e ROSS, 2013).
Um EDW considera os seguintes princípios para a sua construção:
-
- Utiliza Modelagem Dimensional do tipo Star Schema;
- Armazena dados na menor granularidade possível (embora possa também armazenar agrupamentos e sumarizações, realizadas a partir dos dados granulares);
- Os fatos são orientados a processos de negócio, e não a setores ou departamentos específicos;
- Utiliza Dimensões Coformadas.
A Figura abaixo apresenta os elementos chave para a arquitetura Kimball de DW/BI (KIMBALL e ROSS, 2013):
