# Análise de big data (Big data analytics)

<span style="font-weight: 400;">De acordo com o SAS (2022), técnicas de </span>*<span style="font-weight: 400;">big data analytics</span>*<span style="font-weight: 400;"> (análise de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;">) examinam grandes quantidades de dados na tentativa de descobrir padrões ocultos, correlações e outros </span>*<span style="font-weight: 400;">insights</span>*<span style="font-weight: 400;">.</span>

<span style="font-weight: 400;">Para Gandomi e Haider (2015), o potencial do </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;"> surge apenas quando aproveitado para apoiar na tomada de decisões. Para isso, são necessários processos eficientes para transformar grandes volumes de dados, diversos e rápidos, em </span>*<span style="font-weight: 400;">insights</span>*<span style="font-weight: 400;"> significativos.</span>

<span style="font-weight: 400;">O processo geral de extração de </span>*<span style="font-weight: 400;">insights</span>*<span style="font-weight: 400;"> de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;"> pode ser dividido em cinco etapas, como pode ser visto na Figura 1.</span>

[![image-1646849515052.png](https://kb.ufla.br/uploads/images/gallery/2022-03/scaled-1680-/3VFePGlsIWK7Hqvc-image-1646849515052.png)](https://kb.ufla.br/uploads/images/gallery/2022-03/3VFePGlsIWK7Hqvc-image-1646849515052.png)

**Figura 1:** Proceso geral de *big data*. Fonte: <span style="font-weight: 400;">GANDOMI e HAIDER (2015).</span>

<span style="font-weight: 400;">Esses cinco estágios formam os dois principais subprocessos: gerenciamento de dados (</span>*<span style="font-weight: 400;">Data Management</span>*<span style="font-weight: 400;">) e análise (</span>*<span style="font-weight: 400;">Analytics</span>*<span style="font-weight: 400;">). O gerenciamento de dados envolve processos e tecnologias para adquirir, armazenar e preparar os dados para análise. A análise (</span>*<span style="font-weight: 400;">Analytics</span>*<span style="font-weight: 400;">), por outro lado, refere-se às técnicas usadas para analisar e adquirir inteligência a partir de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;">. Deste modo, a análise de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;"> (</span>*<span style="font-weight: 400;">Big data analytics</span>*<span style="font-weight: 400;">) pode ser vista como um subprocesso no processo geral de “extração de insights” de </span>*<span style="font-weight: 400;">big data </span>*<span style="font-weight: 400;">(GANDOMI e HAIDER, 2015).</span>

<span style="font-weight: 400;">De acordo com o SAS (2022), não há uma tecnologia única que englobe a análise de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;">. Existem análises avançadas que podem ser aplicadas a </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;">, mas, na realidade, vários tipos de tecnologia e técnicas precisam trabalhar juntas para a máxima obtenção de valor sobre os dados. </span><span style="font-weight: 400;">SAS (2022) menciona os seguintes componentes relacionados à análise de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;">:</span>

- <span style="font-weight: 400;">**Aprendizado de máquina:** subconjunto específico de Inteligência Artificial, que possibilita a produção de modelos que podem analisar dados maiores e mais complexos e fornecer resultados mais rápidos e precisos – mesmo em uma escala muito grande. Ao construir modelos precisos, uma organização terá mais chances de identificar oportunidades lucrativas – ou evitar riscos desconhecidos;  
      
    </span>
- <span style="font-weight: 400;">**Gestão de dados:** os dados precisam ser de alta qualidade e bem governados antes que possam ser analisados de forma confiável. Com os dados entrando e saindo constantemente de uma organização, é importante estabelecer processos repetíveis para criar e manter padrões de qualidade de dados. Uma vez que os dados sejam confiáveis, as organizações devem estabelecer um programa de gerenciamento de dados mestres que coloque toda a empresa na mesma página;  
      
    </span>
- <span style="font-weight: 400;">**Mineração de dados:** tecnologias de mineração de dados ajudam a examinar grandes quantidades de dados para descobrir padrões – e essas informações podem ser usadas para análises adicionais para ajudar a responder a questões comerciais complexas. Com o software de mineração de dados, pode-se filtrar todo o ruído caótico e repetitivo nos dados, identificar o que é relevante, e usar essas informações para avaliar resultados prováveis e acelerar o ritmo de tomada de decisões;  
      
    </span>
- <span style="font-weight: 400;">**Hadoop:** este framework de código aberto pode armazenar grandes quantidades de dados e executar aplicativos em clusters de hardware comuns. Tornou-se uma tecnologia chave em </span>*<span style="font-weight: 400;">big data;</span>*<span style="font-weight: 400;">  
      
    </span>
- <span style="font-weight: 400;">**Análise *in-memory*:** Ao analisar os dados da memória do sistema (em vez da unidade de disco rígido), você pode obter </span>*<span style="font-weight: 400;">insights</span>*<span style="font-weight: 400;"> imediatos de seus dados e agir rapidamente. Essa tecnologia é capaz de remover latências de preparação de dados e processamento analítico para testar novos cenários e criar modelos; não é apenas uma maneira fácil para as organizações permanecerem ágeis e tomarem melhores decisões de negócios, mas também permite que elas executem cenários de análise iterativos e interativos;  
      
    </span>
- <span style="font-weight: 400;">**Análise preditiva:** a tecnologia de análise preditiva usa dados, algoritmos estatísticos e técnicas de aprendizado de máquina para identificar a probabilidade de resultados futuros com base em dados históricos. Trata-se de fornecer uma melhor avaliação sobre o que acontecerá no futuro, para que as organizações possam se sentir mais confiantes de que estão tomando a melhor decisão de negócios possível;  
      
    </span>
- <span style="font-weight: 400;">**Mineração de texto:** com a tecnologia de mineração de texto, pode-se analisar dados de texto da web, campos de comentários, livros e outras fontes baseadas em texto para descobrir insights, antes não notados. A mineração de texto usa aprendizado de máquina ou tecnologia de processamento de linguagem natural para vasculhar documentos – e-mails, blogs, feeds do Twitter, pesquisas, inteligência competitiva e muito mais – para auxiliar na análise de grandes quantidades de informações e descobrir novos tópicos e relacionamentos de termos.  
      
    </span>

<span style="font-weight: 400;">Gandomi e Haider (2015) descrevem as cinco técnicas de análise de </span>*<span style="font-weight: 400;">big data</span>*<span style="font-weight: 400;"> mais relevantes, de acordo com os autores. As técnicas descritas são listadas abaixo. Para mais detalhes, consultar o artigo referenciado:</span>

- <span style="font-weight: 400;">**Análise de texto:** também chamado de mineração de texto, esta técnica refere-se à extração de informações a partir de dados textuais, como feeds de notícias, e-mails, blogs, fóruns, notícias, questionários, logs de call center, etc;  
      
    </span>
- **Análise de áudio:**<span style="font-weight: 400;"> extração de informações de dados de áudio não estruturados. Quando aplicado à análise da linguagem falada, é também chamado de análise de fala;  
      
    </span>
- **Análise de vídeo:**<span style="font-weight: 400;"> também conhecido como </span>*<span style="font-weight: 400;">video content analysis</span>*<span style="font-weight: 400;"> (VCA), ou análise de conteúdo de vídeo, envolve uma variedade de técnicas para monitorar, analisar e extrair informações a partir de </span>*<span style="font-weight: 400;">streams</span>*<span style="font-weight: 400;"> de vídeo;</span><span style="font-weight: 400;">  
      
    </span>
- **Análise de mídias sociais:**<span style="font-weight: 400;"> análise de dados estruturados e não estruturados provenientes de canais de mídias sociais (facebook, linkedin, twitter, instagram, tumblr, etc.);  
      
    </span>
- **Análises preditivas:**<span style="font-weight: 400;"> análise preditiva compreende uma variedade de técnicas que preveem resultados futuros com base em dados históricos e atuais. Na prática, a análise preditiva pode ser aplicada a quase todas as disciplinas – desde prever a falha de motores a jato com base no fluxo de dados de vários milhares de sensores, até prever os próximos movimentos dos clientes com base no que compram, quando compram e até mesmo no que dizem nas redes sociais. Em sua essência, a análise preditiva busca descobrir padrões e capturar relacionamentos nos dados.</span>