Big Data
Segundo Oussous et al. (2018) o termo big data refere-se a grandes conjuntos de dados, em constante crescimento, que incluem formatos heterogêneos de dados estruturados, não estruturados e semiestruturados. Big data possui natureza complexa e exige tecnologias sofisticadas e algoritmos avançados. Neste novo contexto, ferramentas tradicionais de Business Intelligence mostram-se ineficientes para aplicações de big data.
Muitos experts e cientistas de dados definem big data pelas seguintes características principais (chamadas 3 Vs) (OUSSOUS et al., 2018):
-
- Volume: Grandes volumes de dados são gerados continuamente a partir de milhares de dispositivos e aplicações (smartphones, redes sociais, sensores, logs, etc.)
.; - Velocidade: Dados são gerados de modo rápido e precisam ser processados rapidamente para que insights relevantes sejam
extraídos.extraídos; - Variedade: Big data é gerado a partir de várias fontes e em múltiplos formatos (por exemplo: documentos, vídeos, comentários, logs, etc.). Grandes conjuntos de dados são constituídos por dados estruturados e não estruturados, públicos ou privados, de origem local ou distante, compartilhados ou confidenciais, completos ou incompletos, etc.
- Volume: Grandes volumes de dados são gerados continuamente a partir de milhares de dispositivos e aplicações (smartphones, redes sociais, sensores, logs, etc.)
Oussous et al. (2018) afirmam que alguns autores incluem outros Vs e características à definição de big data:
-
- Visão: um
propósito.propósito; - Verificação: os dados são processados de acordo com alguma
especificação.especificação; - Validação: se o propósito foi
alcançado.alcançado; - Valor: se informações pertinentes podem ser extraídos para muitos setores;
- Complexidade: é difícil organizar e analisar big data devido à constante evolução dos
relacionamentos.relacionamentos; - Imutabilidade: uma vez coletado e armazenado, dados de big data podem ser permanentes se bem gerenciados.
- Visão: um