Ir para o conteúdo principal

Qualidade de Dados

De acordo com Barbieri (2019), existe uma percepção incorreta de que a qualidade de dados esteja estritamente relacionada com os seus aspectos estruturais. A qualidade de dados deve ser analisada em diversos aspectos, dos quais, muitos não estão diretamente relacionados à forma física do dado, mas ao seu entorno.

Barbieri (2019) comenta que há vários autores com variadas classificações de dimensões de qualidade de dados. Abaixo são listados alguns dos conceitos encontrados mais usualmente encontrados na literatura:

  • Completude: Se falta algum atributo de dados do seu registro, como CEP no endereço, não há completude;
  • Unicidade: Se existem dois funcionários com o mesmo CPF, por exemplo, há problemas de unicidade;
  • Razoabilidade: Se a data da receita médica é posterior à data preenchida de compra do medicamento na farmácia, por exemplo, não há razoabilidade;
  • Integridade: Se o mesmo dado possui valores diferentes em locais distintos, não há integridade;
  • Temporalidade: Esta característica define a necessidade do dado estar disponível no tempo exigido e na forma demandada. Por exemplo, a marcação de um assento de voo deverá ocorrer em tempo real para que a sua disponibilidade seja garantida;
  • Validade: Está relacionada com a forma estrutural estabelecida. Por exemplo, se o código de CEP é válido e estão listados nos dados de referência. Se o tipo de dado definido está sendo obedecido, etc.;
  • Cobertura: Dimensão de qualidade que considera o quanto os dados disponíveis atendem, por exemplo, geograficamente, aos seus objetivos. Ex. tenho todos os dados relativos ao Brasil, mas pretendo atuar na Argentina;
  • Precisão: Dimensão de qualidade relativa à precisão do dado cadastrado. Ex: Moro no bairro centro, mas o CEP cadastrado é da pampulha.

Segundo Barbieri (2019), com a evolução da ciência de dados, outros aspectos, como privacidade e ética, passarão a ser considerados dentro dos aspectos de qualidade.