# Data Hub

<span style="font-weight: 400;">De acordo com o Goasduff (2020), *Data Hubs* são “hubs” conceituais, lógicos e físicos para mediação da semântica, em suporte à governança e compartilhamento de dados entre sistemas. *Data Hubs* possibilitam o fluxo contínuo de dados devidamente governados.</span>

Para o DAMA (2017), existem diferentres tipos de *Data Hubs*, uma vez que este é um conceito que objetiva a consolidação e o provimento de dados consistentes tanto para outros sistemas quanto diretamente para para humanos. Neste sentido, DAMA (2017) menciona que *Data Warehouses* e soluções de Gestão de Dados Mestres são tipos de *Data Hubs*.

<span style="font-weight: 400;">Segundo Harrad (2020), o Data Hub é o local ideal para os dados principais de uma organização. Ele centraliza os dados que são críticos entre os aplicativos e permite o compartilhamento contínuo entre diversos </span>*<span style="font-weight: 400;">endpoints</span>*<span style="font-weight: 400;">, ao mesmo tempo em que é a principal fonte de dados confiáveis para a iniciativa de governança de dados. Os </span>*<span style="font-weight: 400;">Data Hubs</span>*<span style="font-weight: 400;"> fornecem Dados Mestres para aplicativos e processos corporativos. Eles também são usados para conectar aplicativos de negócios a estruturas analíticas, como </span>*<span style="font-weight: 400;">data warehouses</span>*<span style="font-weight: 400;"> e </span>*<span style="font-weight: 400;">data lakes</span>*<span style="font-weight: 400;">.</span>

[![image-1647868803510.png](https://kb.ufla.br/uploads/images/gallery/2022-03/scaled-1680-/QqV3ntNP4IXIbhSS-image-1647868803510.png)](https://kb.ufla.br/uploads/images/gallery/2022-03/QqV3ntNP4IXIbhSS-image-1647868803510.png)<span style="font-weight: 400;">**Figura 1:** </span>*<span style="font-weight: 400;">Data Hub </span>*<span style="font-weight: 400;">como pilar principal de dados governados. Fonte: HADDAD (2020).</span>

<span style="font-weight: 400;">Diferentemente de </span>*<span style="font-weight: 400;">Data Warehouses</span>*<span style="font-weight: 400;"> e </span>*<span style="font-weight: 400;">Data Lakes</span>*<span style="font-weight: 400;">, que são focados no provimento de dados para finalidades analíticas, os </span>*<span style="font-weight: 400;">Data Hubs</span>*<span style="font-weight: 400;"> servem como pontos de mediação e compartilhamento de dados, com o foco em governança (HARRAD, 2020).</span>

<span style="font-weight: 400;">*Data warehouses*, *Data Lakes* e *Data Hubs* não são alternativas intercambiáveis, mas sim complementares. Juntos podem apoiar iniciativas baseadas em dados e transformação digital. A tabela abaixo resume suas semelhanças e diferenças HARRAD (2020):</span>

<table id="bkmrk-%C2%A0-data-hub-data-ware" style="border-style: solid; height: 766px;"><tbody><tr style="border-style: solid;"><td style="height: 35px; width: 119.672px;"> </td><td style="height: 35px; width: 218.297px;">***Data Hub***

</td><td style="height: 35px; width: 192.062px;">***Data Warehouse***

</td><td style="height: 35px; width: 278.969px;">***Data Lake***

</td></tr><tr style="border-style: solid;"><td style="height: 35px; width: 119.672px; text-align: justify;">**Uso primário**

</td><td style="height: 35px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Processos operacionais</span>

</td><td style="height: 35px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Análise e relatórios</span>

</td><td style="height: 35px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Análise, relatórios e </span>*<span style="font-weight: 400;">Machine Learning</span>*<span style="font-weight: 400;">.</span>

</td></tr><tr style="border-style: solid;"><td style="height: 57px; width: 119.672px; text-align: justify;">**Formato dos dados**

</td><td style="height: 57px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Estruturados</span>

</td><td style="height: 57px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Estruturados</span>

</td><td style="height: 57px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Estruturados e não estruturados</span>

</td></tr><tr style="border-style: solid;"><td style="height: 80px; width: 119.672px; text-align: justify;">**Governança de Dados**

</td><td style="height: 80px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Pilar principal para todas as regras de aplicação de governança de dados</span>

</td><td style="height: 80px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Governança pós-fato, pois consome dados operacionais existentes</span>

</td><td style="height: 80px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Abordagem de dados “Use por sua conta e risco”. Pouco governado</span>

</td></tr><tr style="border-style: solid;"><td style="height: 57px; width: 119.672px; text-align: justify;">**Qualidade de Dados**

</td><td style="height: 57px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Altíssima qualidade</span>

</td><td style="height: 57px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Alta qualidade</span>

</td><td style="height: 57px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Média e baixa qualidade</span>

</td></tr><tr style="border-style: solid;"><td style="height: 169px; width: 119.672px; text-align: justify;">**Integração com aplicações**

</td><td style="height: 169px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Integração bidirecional em tempo real com processos de negócios existentes por meio de APIs.</span>

</td><td style="height: 169px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">ETL monodirecional em lote. Os dados transformados e limpos são atualizados em baixa frequência (por hora, diariamente ou semanalmente)</span>

</td><td style="height: 169px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">ETL ou ELT monodirecional em lote. Os dados são despejados sem controle, assumindo uma limpeza futura pelo consumidor</span>

</td></tr><tr style="border-style: solid;"><td style="height: 169px; width: 119.672px; text-align: justify;">**Interação com usuários de negócio**

</td><td style="height: 169px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Pode ser a fonte primária de autoria de elementos-chave de dados, como Dados Mestre e Dados de Referência. Expõe interfaces amigáveis para criação de dados, administração de dados e pesquisa.</span>

</td><td style="height: 169px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Oferece acesso somente leitura a dados limpos e preparados, por meio de relatórios, painéis analíticos ou consultas ad-hoc.</span>

</td><td style="height: 169px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Requer limpeza/preparação de dados antes do consumo. O acesso aos usuários corporativos é oferecido principalmente por meio de relatórios, painéis ou consultas ad-hoc. Usado para preparar conjuntos de dados de aprendizado de máquina.</span>

</td></tr><tr style="border-style: solid;"><td style="height: 164px; width: 119.672px; text-align: justify;">**Processos Operacionais da organização**

</td><td style="height: 164px; width: 218.297px; text-align: justify;"><span style="font-weight: 400;">Repositório principal para dados confiáveis expostos em processos de negócios. Pode ser o principal condutor dos processos de negócios corporativos.</span>

</td><td style="height: 164px; width: 192.062px; text-align: justify;"><span style="font-weight: 400;">Serve principalmente para processos de análise.</span>

</td><td style="height: 164px; width: 278.969px; text-align: justify;"><span style="font-weight: 400;">Atende principalmente processos de </span>*<span style="font-weight: 400;">Machine Learning</span>*<span style="font-weight: 400;">.</span>

</td></tr></tbody></table>