Big Data
Segundo Oussous et al. (2018) o termo big data refere-se a grandes conjuntos de dados, em constante crescimento, que incluem formatos heterogêneos de dados estruturados, não estruturados e semiestruturados. Big data possui natureza complexa e exige tecnologias sofisticadas e algoritmos avançados. Neste novo contexto, ferramentas tradicionais de Business Intelligence mostram-se ineficientes para aplicações de big data.
Muitos experts e cientistas de dados definem big data pelas seguintes características principais (chamadas 3 Vs) (OUSSOUS et al., 2018):
-
- Volume: Grandes volumes de dados são gerados continuamente a partir de milhares de dispositivos e aplicações (smartphones, redes sociais, sensores, logs, etc.).
- Velocidade: Dados são gerados de modo rápido e precisam ser processados rapidamente para que insights relevantes sejam extraídos.
- Variedade: Big data é gerado a partir de várias fontes e em múltiplos formatos (por exemplo: documentos, vídeos, comentários, logs, etc.). Grandes conjuntos de dados são constituídos por dados estruturados e não estruturados, públicos ou privados, de origem local ou distante, compartilhados ou confidenciais, completos ou incompletos, etc.
Oussous et al. (2018) afirmam que alguns autores incluem outros Vs e características à definição de big data:
-
- Visão: um propósito.
- Verificação: os dados são processados de acordo com alguma especificação.
- Validação: se o propósito foi alcançado.
- Valor: se informações pertinentes podem ser extraídos para muitos setores;
- Complexidade: é difícil organizar e analisar big data devido à constante evolução dos relacionamentos.
- Imutabilidade: uma vez coletado e armazenado, dados de big data podem ser permanentes se bem gerenciados.