Termos e Definições - Governança de Dados
Livro com termos e definições relacionados à gestão e governança de dados.
#Referências
AMAZON. What is Apache Spark?. Disponível em: <https://aws.amazon.com/big-data/what-is-spark/>....
Gestão de Dados
Dados precisam ser vistos como ativos críticos para o sucesso das atividades operacionais e admin...
Governança de Dados
O DMBOK (DAMA-DMBOK, 2017) define Governança de Dados (GD) como a execução de autoridade, control...
Glossário de Negócios
Um glossário de negócios é um tipo de dicionário que busca garantir coerência e consistência semâ...
Gerência de Dados Mestres e de Referência
Em qualquer organização, certos dados são comuns entre diferentes áreas de negócio, processos e s...
Business Intelligence
Business Intelligence (BI), ou Inteligência de Negócios é um termo abrangente que pode ser defini...
Data Warehouse
Data Warehouse (DW) consiste em um sistema para armazenamento de dados originados de múltiplas fo...
Data Warehousing
De acordo com o DAMA (2017), Data Warehousing refere-se aos processos operacionais de extração, l...
Data Mart
Um Data Mart é um subconjunto completo de um Data Warehouse, e, assim como este, deve possuir os ...
Big Data
De acordo com Salinas e Lemus (2017), o termo Big Data foi criado em 1997 por Michael Cox e David...
Tecnologias de Big Data
Os sistemas de Data Warehouse são tradicionalmente suportados por modelos multidimensionais prede...
Big Data vs Data Warehouse
Diferentemente de um Data Warehouse, o Big Data vai além da consolidação de informações, pois é u...
Análise de big data (Big data analytics)
De acordo com o SAS (2022), técnicas de big data analytics (análise de big data) examinam grandes...
Data Lake
Embora Data Warehouses sejam ainda muito relevantes e muito poderosos para dados estruturados, nã...
Data Lakehouse
Data Lakes, como um conceito moderno de armazenamento de dados em formato nativo, foi apresentado...
Data Mesh
Em 2019, no artigo How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh, Zhamak D...
Data Hub
De acordo com o Goasduff (2020), Data Hubs são “hubs” conceituais, lógicos e físicos para mediaçã...
Integração e Governança de Dados
A necessidade de gerenciar a complexidade, juntamente com os seus custos decorrentes, são os moti...
Qualidade de Dados
Existe uma percepção incorreta de que a qualidade de dados esteja estritamente relacionada com os...
Linhagem de Dados
De acordo com Kimball e Ross (2013), a linhagem de dados descreve as origens e as etapas de proce...
ETL
De acordo com Kimball e Ross (2010), ETL (Extract, Transform, Load) consiste em um paradigma padr...
Staging Area
De acordo com Kimball e Ross (2010), Staging Area é o local onde os dados fontes são transformado...
EDW e Modelagem Dimensional
Modelagem Dimensional
Modelagem dimensional é uma disciplina de design que abrange a modelagem relacional formal e a en...
Arquitetura de Barramento do Enterprise Data Warehouse
A arquitetura de barramento do Enterprise Data Warehouse (Enterprise Data Warehouse Bus Architect...
Matriz de Barramento
A matriz de barramento do Enterprise Data Warehouse (Enterprise Data Warehouse Bus Matrix) é uma ...
Tabela Fato
Tabelas Fato são tabelas para armazenamento de medidas. A maioria das medidas armazenadas em Tabe...
Tabela de Dimensão
Tabelas de dimensão são companheiras integrais de Tabelas Fato. Tabelas de dimensão possuem descr...
Star Schema
Agora que você entende as Tabelas Fato e Dimensões, é hora de reunir os blocos de construção em u...
Tabela Fato sem Fato
Tabela Fato sem fato (Factless Fact Tables) são Tabelas Fato que não possuem nada além de chaves ...
Tabela Fato de Snapshot Periódico
Uma linha em uma Tabela Fato de Snapshot Periódico (Periodic Snapshot Fact Table) sumariza divers...
Fatos Conformados
Se a mesma medida aparece em diferentes Tabelas Fato, deve ser tomado o devido cuidado para que a...
Chaves Dimensionais
Se fatos são medidas reais geradas rapidamente, concluímos que Tabelas Fato criam uma situação de...
Tabela Fato Transacional
De acordo com Kimball e Ross (2013) uma Tabela Fato Transacional (Transaction Fact Table) é um ti...
Tabela Fato de Snapshot Acumulado
De acordo com (Kimball e Ross, 2013), uma Tabela Fato de Snapshot Acumulado (Accumulating Snapsho...
Natural Key
Uma Natural Key (NK) é uma chave única, composta por uma ou mais colunas, que identificam um regi...
Dimensões de Etapa (Step Dimensions)
Processos sequenciais, como eventos de página da Web, normalmente têm uma linha separada em uma t...
Tabelas Fato Agregadas
Em adição às Tabelas Fato que armazenam dados atômicos relativos a fatos únicos de processos, tab...
Fatos Aditivos
No coração de qualquer Tabela Fato existe uma lista de fatos que representam medidas. Como a maio...
Dimensões Multivaloradas e Tabelas Ponte (bridge table)
Em um esquema dimensional clássico, cada dimensão anexada a uma tabela de fatos tem um único valo...
Tabelas Fato Consolidadas
Frequentemente, é conveniente combinar fatos de vários processos em uma única Tabela Fatos consol...
Fatos Agregados e Atributos de Dimensões
Usuários de negócio geralmente estão interessados em restringir a dimensão do cliente com base em...
Dimensões Genéricas Abstratas
Alguns modeladores são atraídos por dimensões genéricas abstratas. Por exemplo, seus esquemas inc...
Dimensões de comentário
Em vez de tratar os comentários de forma livre como métricas textuais em uma tabela de fatos, ele...
Dimensões de Auditoria
Quando uma linha da tabela de fatos é criada pelo processo de ETL, é útil criar uma dimensão de a...
Dimensão Conformada
Uma Dimensão Conformada (também chamada de Dimensão Compartilhada ou Dimensão Mestre) é uma dimen...
Dimensões reduzidas (Shrunken Dimensions)
Dimensões reduzidas são dimensões conformadas que são um subconjunto de linhas e/ou colunas de um...
Slowly Changing Dimensions
Slowly Changing Dimensions (SCD) consiste em técnicas para gerenciamento da história de dados dim...
Dimensões Degeneradas
Em diversas situações onde a granularidade é um filho de algum evento maior, a chave natural dest...
Mantendo a Granularidade na Modelagem Dimensional
Embora teoricamente qualquer mistura de fatos possa ser incluída em uma mesma tabela, um design d...
Pense Dimensionalmente
Ao reunir os requisitos para uma iniciativa de DW/BI, você precisa ouvir e em seguida, sintetizar...
Schemas de Eventos de Erros
Gerenciar a qualidade de dados em um Data Warehouse requer um sistema abrangente de qualidade que...
Surrogate Key
Uma Surrogate Key (SK), ou chave substituta, assim como uma Natural Key (NK), é um identificador ...
Data Profiling
Ao longo do processo de modelagem dimensional, a equipe precisa desenvolver uma compreensão cada ...