Blockchain é uma solução para a manipulação de big data?

cadeia de blocosAs mais recentes tecnologias têm permitido com que o big data cresça e tenha cada vez mais valor. Principalmente nos ramos de Business Intelligence (BI), engenharia e ciência de dados, o conceito de big data tem permitido com que modelos de aprendizado de máquina reconheçam padrões e tragam insights relevantes para empresas e indústrias.

Uma das tecnologias mais emergentes do momento é o blockchain. Blockchain, como o próprio nome diz, consiste em uma cadeia ordenada de blocos. Esses blocos, por sua vez, contêm informações armazenadas na forma de dados, como transações financeiras, por exemplo.

O blockchain surgiu dentro do conceito de Bitcoin, que é um sistema de pagamentos global descentralizado. A forma com que as transações são validadas e armazenadas é justamente nesse livro-razão chamado blockchain, funcionando como um registro contábil. Muitas pessoas, inclusive, acreditam que uma forma de investir em blockchain é por meio de BTC, aprendendo como comprar Bitcoin e guardando para o longo prazo, até a tecnologia florescer mais e atingir todo o seu potencial.

Um dos pontos interessantes do blockchain é a sua segurança. Cada vez mais, a privacidade dos dados e questões relacionadas a segurança têm sido um assunto sério. Uma forma de garantir segurança no blockchain é por meio de duplas camadas de criptografia (o Bitcoin, por exemplo, utiliza SHA 256 e ECDSA).

Outra forma de garantir segurança é por meio do protocolo de consenso utilizado para introduzir novos blocos na cadeia, que no caso do Bitcoin é o Proof of Work (PoW). Nesse processo, múltiplos computadores ao redor do mundo tentam resolver um problema matemático, encontrando um número que possua uma saída da função menor ou igual a certo número bem pequeno (função de via única). O primeiro a resolver, informa o número no hash do bloco e transmite para os nodes da rede validarem. O criador de um novo bloco também é chamado de minerador.

Mas blockchain não serve apenas para transações financeiras, muitos outros projetos têm trabalhado com blockchain para armazenar os mais diversos tipos de dados, desde a área médica até cadeias de suprimento e logística. A IBM, por exemplo, possui uma área de pesquisa focada nisso.

Evidentemente, a tecnologia ainda enfrenta alguns desafios como escalabilidade limitada, devido a sua estrutura descentralizada. O fato é que veremos cada vez mais soluções sendo apresentadas, o que permitirá que o valor do big data seja cada vez mais explorado.

Como a análise de dados tem sido útil para outros campos

dados sendo analisadosO estudo da análise de dados está ficando cada vez mais abrangente. Partindo de uma simples estrutura que avalia e classifica informações, a análise de dados se transformou no campo amplo do Big Data, que consiste na manipulação de grandes quantidades de dados visando a extrair insights e informações relevantes.

Atualmente, o conteúdo que verdadeiramente é analisado profundamente na internet é de menos de 5%. Todo o restante é desprezado pela dificuldade de tratamento (realmente, existe muito conteúdo inútil, e a dificuldade está exatamente no fato de se conseguir separar dados relevantes dos irrelevantes).

Paralelamente ao surgimento e crescimento do Big Data, outro ramo emergente ganhou muita força: o ramo da inteligência artificial!

A inteligência artificial restrita tem hoje dois principais campos de ação: o machine learning e o deep learning, campos de estudo que têm revolucionado a forma como interagimos com as máquinas. A robótica, por exemplo, está avançando a passos largos graças ao avanços desses campos.

Mas o machine learning também sobre do mesmo problema do big data: obtenção de grande quantidade de dados para tratamento. O aprendizado não-supervisionado, por exemplo, precisa de muitos dados para que o programa possa ser treinado repetidas vezes até atingir a perfeição.

Algumas estratégias no campo da inteligência artificial colaboram para a obtenção de melhores resultados, como as redes neurais convolucionais, que possuem inspiração biológica a partir de um campo receptivo e um mapa de ativação. Esse tipo de abordagem é muito utilizado no processamento de imagens, por exemplo.

Além da inteligência artificial, o processamento de dados também tem apresentado aplicações em tecnologias mais emergentes como o blockchain, que tem mostrado vantagens de processamento em diversos campos, principalmente no quesito autenticidade dos dados e validação da imutabilidade das informações via consenso (que pode ser via Proof of Work – PoW ou Proof of Stake – PoS). Essa tecnologia teve origem no protocolo do Bitcoin e depois passou a ser adotado em outros projetos como Ethereum.

O vídeo abaixo ajuda a compreender um pouco melhor a jornada da ciência de dados e quais serão os próximos passos dessa tecnologia: