Termos e Definições - Governança de Dados

Livro com termos e definições relacionados à gestão e governança de dados.

#Referências

AMAZON. What is Apache Spark?. Disponível em: <https://aws.amazon.com/big-data/what-is-spark/>....

Gestão de Dados

Dados precisam ser vistos como ativos críticos para o sucesso das atividades operacionais e admin...

Governança de Dados

O DMBOK (DAMA-DMBOK, 2017) define Governança de Dados (GD) como a execução de autoridade, control...

Glossário de Negócios

Um glossário de negócios é um tipo de dicionário que busca garantir coerência e consistência semâ...

Gerência de Dados Mestres e de Referência

Em qualquer organização, certos dados são comuns entre diferentes áreas de negócio, processos e s...

Business Intelligence

Business Intelligence (BI), ou Inteligência de Negócios é um termo abrangente que pode ser defini...

Data Warehouse

Data Warehouse (DW) consiste em um sistema para armazenamento de dados originados de múltiplas fo...

Data Warehousing

De acordo com o DAMA (2017), Data Warehousing refere-se aos processos operacionais de extração, l...

Data Mart

Um Data Mart é um subconjunto completo de um Data Warehouse, e, assim como este, deve possuir os ...

Big Data

De acordo com Salinas e Lemus (2017), o termo Big Data foi criado em 1997 por Michael Cox e David...

Tecnologias de Big Data

Os sistemas de Data Warehouse são tradicionalmente suportados por modelos multidimensionais prede...

Big Data vs Data Warehouse

Diferentemente de um Data Warehouse, o Big Data vai além da consolidação de informações, pois é u...

Análise de big data (Big data analytics)

De acordo com o SAS (2022), técnicas de big data analytics (análise de big data) examinam grandes...

Data Lake

Embora Data Warehouses sejam ainda muito relevantes e muito poderosos para dados estruturados, nã...

Data Lakehouse

Data Lakes, como um conceito moderno de armazenamento de dados em formato nativo, foi apresentado...

Data Mesh

Em 2019, no artigo How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh, Zhamak D...

Data Hub

De acordo com o Goasduff (2020), Data Hubs são “hubs” conceituais, lógicos e físicos para mediaçã...

Integração e Governança de Dados

A necessidade de gerenciar a complexidade, juntamente com os seus custos decorrentes, são os moti...

Qualidade de Dados

Existe uma percepção incorreta de que a qualidade de dados esteja estritamente relacionada com os...

Linhagem de Dados

De acordo com Kimball e Ross (2013), a linhagem de dados descreve as origens e as etapas de proce...

ETL

De acordo com Kimball e Ross (2010), ETL (Extract, Transform, Load) consiste em um paradigma padr...

Staging Area

De acordo com Kimball e Ross (2010), Staging Area é o local onde os dados fontes são transformado...

EDW e Modelagem Dimensional

Modelagem Dimensional

Modelagem dimensional é uma disciplina de design que abrange a modelagem relacional formal e a en...

Arquitetura de Barramento do Enterprise Data Warehouse

A arquitetura de barramento do Enterprise Data Warehouse (Enterprise Data Warehouse Bus Architect...

Matriz de Barramento

A matriz de barramento do Enterprise Data Warehouse (Enterprise Data Warehouse Bus Matrix) é uma ...

Tabela Fato

Tabelas Fato são tabelas para armazenamento de medidas. A maioria das medidas armazenadas em Tabe...

Tabela de Dimensão

Tabelas de dimensão são companheiras integrais de Tabelas Fato. Tabelas de dimensão possuem descr...

Star Schema

Agora que você entende as Tabelas Fato e Dimensões, é hora de reunir os blocos de construção em u...

Tabela Fato sem Fato

Tabela Fato sem fato (Factless Fact Tables) são Tabelas Fato que não possuem nada além de chaves ...

Tabela Fato de Snapshot Periódico

Uma linha em uma Tabela Fato de Snapshot Periódico (Periodic Snapshot Fact Table) sumariza divers...

Fatos Conformados

Se a mesma medida aparece em diferentes Tabelas Fato, deve ser tomado o devido cuidado para que a...

Chaves Dimensionais

Se fatos são medidas reais geradas rapidamente, concluímos que Tabelas Fato criam uma situação de...

Tabela Fato Transacional

De acordo com Kimball e Ross (2013) uma Tabela Fato Transacional (Transaction Fact Table) é um ti...

Tabela Fato de Snapshot Acumulado

De acordo com (Kimball e Ross, 2013), uma Tabela Fato de Snapshot Acumulado (Accumulating Snapsho...

Natural Key

Uma Natural Key (NK) é uma chave única, composta por uma ou mais colunas, que identificam um regi...

Dimensões de Etapa (Step Dimensions)

Processos sequenciais, como eventos de página da Web, normalmente têm uma linha separada em uma t...

Tabelas Fato Agregadas

Em adição às Tabelas Fato que armazenam dados atômicos relativos a fatos únicos de processos, tab...

Fatos Aditivos

No coração de qualquer Tabela Fato existe uma lista de fatos que representam medidas. Como a maio...

Dimensões Multivaloradas e Tabelas Ponte (bridge table)

Em um esquema dimensional clássico, cada dimensão anexada a uma tabela de fatos tem um único valo...

Tabelas Fato Consolidadas

Frequentemente, é conveniente combinar fatos de vários processos em uma única Tabela Fatos consol...

Fatos Agregados e Atributos de Dimensões

Usuários de negócio geralmente estão interessados em restringir a dimensão do cliente com base em...

Dimensões Genéricas Abstratas

Alguns modeladores são atraídos por dimensões genéricas abstratas. Por exemplo, seus esquemas inc...

Dimensões de comentário

Em vez de tratar os comentários de forma livre como métricas textuais em uma tabela de fatos, ele...

Dimensões de Auditoria

Quando uma linha da tabela de fatos é criada pelo processo de ETL, é útil criar uma dimensão de a...

Dimensão Conformada

Uma Dimensão Conformada (também chamada de Dimensão Compartilhada ou Dimensão Mestre) é uma dimen...

Dimensões reduzidas (Shrunken Dimensions)

Dimensões reduzidas são dimensões conformadas que são um subconjunto de linhas e/ou colunas de um...

Slowly Changing Dimensions

Slowly Changing Dimensions (SCD) consiste em técnicas para gerenciamento da história de dados dim...

Dimensões Degeneradas

Em diversas situações onde a granularidade é um filho de algum evento maior, a chave natural dest...

Mantendo a Granularidade na Modelagem Dimensional

Embora teoricamente qualquer mistura de fatos possa ser incluída em uma mesma tabela, um design d...

Pense Dimensionalmente

Ao reunir os requisitos para uma iniciativa de DW/BI, você precisa ouvir e em seguida, sintetizar...

Schemas de Eventos de Erros

Gerenciar a qualidade de dados em um Data Warehouse requer um sistema abrangente de qualidade que...

Surrogate Key

Uma Surrogate Key (SK), ou chave substituta, assim como uma Natural Key (NK), é um identificador ...

Data Profiling

Ao longo do processo de modelagem dimensional, a equipe precisa desenvolver uma compreensão cada ...