quinta-feira, 12 de fevereiro de 2015

Afinal de contas, o que é Big Data?





Fora a abordagem marqueteira de certas empresas, o que é realmente Big Data? Qual a diferença para Business Intelligence? Como podemos começar a estudar isso?



Chegou a hora de falar sobre Big Data, assunto que deixei de lado por muito tempo. Porém, quando vejo a confusão que as pessoas fazem, me sinto na obrigação de comentar alguma coisa.

Nesse primeiro artigo, não vou entrar muito a fundo, querendo apenas lançar as bases para uma futura série sobre Big Data.

Big Data



É uma abordagem tecnológica para análise de grandes volumes de dados, com vistas à predição de comportamentos e adequação de estratégia de negócios.

Esta abordagem se baseia em 5 "V":

  • Velocidade: Uso de fontes de dados dinâmicas e eventos, além de tabelas estáticas

  • Volume: Análise de grandes volumes de dados, muitas vezes além da capacidade de um único site

  • Variedade: Uso de fontes variadas sobre um assunto, como dados estruturados (bancos de dados) e não estruturados, como comentários em redes sociais, por exemplo

  • Veracidade: Os dados e sua análise devem ser confiáveis, de modo a evitar erros de interpretação

  • Valor: O esforço de implementação de Big Data deve gerar valor para a Empresa, como: Aumento de participação no mercado, Retenção de Clientes ou Valorização da Marca


(Baseado no artigo da Wikipedia)

As operações de Big Data são dinâmicas e em "tempo real". Por exemplo, saber o que as pessoas estão pensando sobre o novo comercial da sua marca, apresentado em um grande evento (final de campeonato ou em um Show).

Operações de Big Data, geralmente, excedem a capacidade de um único site, sendo candidatas ideais para execução em nuvem, com escalabilidade elástica.

Existem muitas plataformas para implementação de soluções Big Data, sendo o Apache Hadoop, uma das mais populares.

Confusão com Business Intelligence



Os marqueteiros, que nunca fizeram uma faculdade de TI, sempre confundem as duas coisas. Talvez seja de propósito, para vender suas soluções de BI como se fossem de Big Data.

Tem um artigo muito interessande na ComputerWorld, que explica as diferenças entre as duas abordagens:

http://computerworld.com.br/tecnologia/2014/11/04/qual-a-diferenca-entre-bi-e-big-data/

Leituras interessantes



Tem dois livros gratuitos na Amazon Kindle Store, que você pode ler em seu tablet, celular, ou mesmo em seu computador (usando o Kindle cloud Reader):