Bigdata: para entender o mundo que estamos vivendo. E o que está por vir! - por Fabiano Castello | Big Data para profissionais "Non-Tech"

Artigos

12 Setembro, 2017

Marcelo Veras, CEO e professor da Inova Business School, escreve neste espaço sobre gestão de carreira e desenvolvimento de competências. Já fez isto mais de 300 vezes.  É uma inspiração inclusive por saber que ele, um dia, publicou o seu primeiro artigo. Espero seguir este sucesso.

Sobre bigdata muitos já ouviram falar e muitos querem saber do que se trata. É um assunto que nos últimos anos esteve mais restrito ao público ligado a tecnologia, mas que hoje é o dia a dia de todos nós. Nossa intenção nesta coluna é popularizar este conhecimento, torná-lo acessível a mais pessoas. Nossa proposta é bem direta: falar sobre bigdata de uma forma descomplicada e descontraída, sem clichês técnicos. Seja bem-vindo!

Entender bigdata, e aplicações que a ela estão relacionadas, como por exemplo aprendizado de máquina ("machine learning"), tem a ver com entender o mundo em que estamos vivendo, o que é possível hoje, o que será possível no futuro e os riscos que estão relacionados. Quando você faz pesquisas no Google, seus dados ficam guardados, e é por isso que você se identifica com as propagandas que vê quando surfa na internet. O waze não descobre o melhor caminho por acaso, bem como as recomendações do Netflix são baseadas em grupos que, de alguma forma, você se encaixa. Tudo está relacionado, ou, melhor ainda, associado.

Que tal começarmos com a própria definição de bigdata? Não é um termo novo. O assunto ganhou notoriedade na capa da revista The Economist em fevereiro de 2010, numa reportagem chamada "O Diluvio de Dados". Tecnicamente você encontra mais informação na wikipedia, inclusive sobre os famosos 5 V's do bigdata: velocidade, volume, variedade, veracidade e valor.

Bidgata refere-se à imensa quantidade de dados que são coletados e armazenados. Podem ter uma estrutura bem definida, como uma planilha eletrônica com linhas e colunas, ou não possuírem nenhuma estrutura formal, como por exemplo e-mails, mensagens (inclusive de áudio), posts, vídeos, artigos e reportagens.

Essa imensa quantidade de dados é fruto da combinação de duas coisas. Primeiro, o custo de armazenamento de dados vem caindo drasticamente ao longo da última década. Já existem experiências para armazenar informações em DNA, inclusive com estimativa de que todo o conhecimento da humanidade, armazenado desta forma, pesará menos de 1 kilo! Segundo, aumentamos, também drasticamente, nossa capacidade de coletar dados. Não apenas tudo que fazemos na internet fica registrado como a tecnologia IoT (lê-se "aiôtí"), ou internet das coisas, coleta dados das mais variadas formas. São sensores e câmeras que já estão presentes tanto em lojas quanto em fábricas, e que podem ajudar a revelar desde o humor do cliente até prever um equipamento que deixará de funcionar em breve.

Bigadata em si é menos importante do que fazemos com toda esta informação e como tiramos proveito disso: temos que falar sobre analytics. Trataremos disso na próxima coluna. Até lá!

Glossário
Em toda a coluna vamos traduzir um termo técnico em uma definição mais simples de ser entendida. Se você tem algum para sugerir mande para mim em fabiano@inovabs.com.br.
Nuvem ou Cloud: este termo não está relacionado diretamente a bigdata, mas há muita confusão. Quando se usa hoje em dia o termo nuvem ou cloud, estamos nos referindo a alguma coisa que está baseada na internet, ou seja, não está funcionando ou armazenada no nosso computador, celular ou tablet. Assim, pegando o próprio exemplo de bigdata, dados podem estar armazenados no nosso computador ou em algum servidor na internet, como por exemplo o Google Drive. Se está na internet, está na nuvem!