Ir para o conteúdo principal

Big Data

Segundo Oussous et al. (2018) o termo big data refere-se a grandes conjuntos de dados, em constante crescimento, que incluem formatos heterogêneos de dados estruturados, não estruturados e semiestruturados. Big data possui natureza complexa e exige tecnologias sofisticadas e algoritmos avançados. Neste novo contexto, ferramentas tradicionais de Business Intelligence mostram-se ineficientes para aplicações de big data.

Muitos experts e cientistas de dados definem big data pelas seguintes características principais (chamadas 3 Vs) (OUSSOUS et al., 2018):

    • Volume: Grandes volumes de dados são gerados continuamente a partir de milhares de dispositivos e aplicações (smartphones, redes sociais, sensores, logs, etc.).
    • Velocidade: Dados são gerados de modo rápido e precisam ser processados rapidamente para que insights relevantes sejam extraídos.
    • Variedade: Big data é gerado a partir de várias fontes e em múltiplos formatos (por exemplo: documentos, vídeos, comentários, logs, etc.). Grandes conjuntos de dados são constituídos por dados estruturados e não estruturados, públicos ou privados, de origem local ou distante, compartilhados ou confidenciais, completos ou incompletos, etc.

Oussous et al. (2018) afirmam que alguns autores incluem outros Vs e características à definição de big data:

    • Visão: um propósito.
    • Verificação: os dados são processados de acordo com alguma especificação.
    • Validação: se o propósito foi alcançado.
    • Valor: se informações pertinentes podem ser extraídos para muitos setores;
    • Complexidade: é difícil organizar e analisar big data devido à constante evolução dos relacionamentos.
    • Imutabilidade: uma vez coletado e armazenado, dados de big data podem ser permanentes se bem gerenciados.