Você pode nunca ter ouvido falar desse termo “Big Data” antes, mas tenha certeza de que ele tem profundo impacto na sua vida diariamente. Basicamente, Big Data é o termo utilizado para descrever um imenso volume de dados, estruturados e não estruturados. Contudo, o importante sobre isso não é exatamente o volume de dados, mas sim o que as empresas responsáveis por eles fazem com isso.

Pense em um imenso banco de dados, como os arquivos de uma rede social como o Facebook ou de um buscador como o Google. Estamos falando de milhões de terabytes que precisam ser processados, organizados e disponibilizados de forma acessível para os interessados. A internet é praticamente toda feita disso, e você usa essa rede para muitas coisas com bastante frequência.

A internet é praticamente toda feita disso

O TecMundo conversou com o professor e especialista na área, Diógenes Justo, para entender melhor como isso impacta a sociedade. Caso você queira aprender com ele e se tornar um cientista de dados, confira este curso da FIAP que acontece em julho. Fique de olho, pois as inscrições podem ser encerradas em breve.

O professor Justo nos explicou que o trabalho do cientista de dados é basicamente preparar um grande volume dados, Big Data, para que eles se tornem acessíveis e organizados de alguma forma. Esses dados podem estar espalhados ou agrupados em locais diferentes.

O cientista de dados utiliza técnicas específicas para análise

“O cientista de dados utiliza técnicas específicas para análise, coisa que não seria possível fazer apenas olhando uma planilha, por exemplo”, comentou Justo sobre o básico da profissão. Ele ainda tomou como exemplo uma loja online hipotética que teria 15 mil produtos diferentes para vender.

Nesse caso, o cientista de dados precisa ter um leque de habilidades para conseguir trabalhar sobre os dados desse e-commerce. “A técnica engloba matemática, programação para automatizar os cálculos e tem que saber um pouco sobre negócios também”, explicou.

Carreira promissora

Ciência de dados ainda é uma área bem limitada e carente de profissionais, no Brasil e no mundo. Diógenes Justo deixou claro ao TecMundo que estamos falando de uma profissão “extremamente promissora” e que já está gerando uma série de oportunidades para quem tem conhecimento sobre o assunto.

“Estou com uma vaga em aberto e tenho mais dez pedidos de indicação”. Mesmo na crise, ninguém deve ficar desempregado sendo um cientista de dados.

O problema é que ainda não existem cursos de graduação para formar cientistas de dados no Brasil. Uma pessoa interessada nesse segmento precisa primeiro fazer alguma graduação relacionada e, depois, procurar uma pós-graduação (existem pelo menos seis universidades renomadas com cursos nessa área) ou cursos de extensão.

Estou com uma vaga em aberto e tenho mais dez pedidos de indicação

Caso você queira apenas ser introduzido ao assunto para ter certeza de que poderá de fato fazer uma pós e se embrenhar nessa área, vale a pena conferir o coursera.org. A plataforma tem uma série de cursos online, incluindo “Big Data” e “Data Science”. O próprio Justo já aproveitou essa oportunidade. “Eu já fiz uns 30 cursos desses para revisar conceitos e atualizar os conhecimentos”, explicou.

De acordo com Diógenes, toda empresa que lida com um grande volume de dados precisa de pelo menos um cientista de dados. Boa parte delas está ligada ao mercado financeiro, mas muitas são startups que estão iniciando projetos inovadores com Big Data.

Futuro da web, da Internet das Coisas e I.A.

Justo também explicou que a internet e o Big Data estão profundamente conectados. “A internet por si só é geradora de Big Data. Nosso papel é utilizar a ciência de dados para aproveitar melhor o poder da internet, de ter um volume de dados, e gerar soluções para um mundo melhor. Temos que resolver os problemas das pessoas”, detalhou.

A ciência de dados também está ligada com a internet das coisas pelo fato de que, quanto mais aparelhos estiverem conectados à rede, mais dados eles vão requerer, exigindo um processamento mais inteligente por parte dos que lidam com Big Data. Em um cenário em que novas soluções não sejam criadas para acomodar essa nova demanda, poderíamos simplesmente ter um blecaute.

A internet por si só é geradora de Big Data

Um cientista de dados também trabalha para desenvolver inteligência artificial (I.A.). Grandes empresas como Google, Microsoft, Facebook e Apple estão empenhadas em levar softwares com I.A para o consumidor e esse trabalho requer basicamente criar processos automáticos e inteligentes para organizar e processar dados.

Justo destacou a área do “deep learning”, que faz parte do segmento de “machine learning”. Basicamente, esses conceitos permitem que computadores aprendam a encontrar padrões por si só depois de receber algumas instruções a algoritmos dos desenvolvedores.

O próprio Google Fotos, por exemplo, conta com uma I.A. baseada nesses conceitos, que transforma dados não estruturados (imagens, sons etc.) em dados estruturados, avaliando cada bit desses arquivos e encontrando semelhanças entre eles.

Você encontra fotos de gatos apenas pesquisando "gato"

Com isso, o sistema da Google organiza fotos, identifica elementos dentro das capturas e permite que você pesquise fotos de gatos, por exemplo, apenas escrevendo “gato” na barra de buscas.

Outros softwares de inteligência artificial devem se tornar cada vez mais populares em um futuro próximo, e isso pode mudar a forma como interagimos com a web e como enxergamos essa rede global de computadores. Isso também vai mudar nossos computadores, smartphones e outros aparelhos, que hoje são basicamente ferramentas e devem se tornar cada vez mais nossos assistentes.

Você tem alguma ideia do que é Big Data? Comente no Fórum do TecMundo

Cupons de desconto TecMundo: