Alavancada pela popularização da internet e pela procura de empresas e governos, a carreira de cientista de dados cresceu e começou a chamar a atenção de pessoas interessadas em ingressar nessa área.

No entanto, uma barreira comum que pode impedir muita gente com potencial de entrar na data science é o vocabulário. É completamente normal não conhecer uma ou outra palavra utilizada por esses profissionais, especialmente para quem está iniciando. Foi pensando nisso que preparamos o glossário abaixo, contendo os principais termos usados na ciência de dados. Com ele, você sai na frente na hora começar os estudos.

Algoritmo

O conceito de algoritmo é normalmente comparado a uma receita culinária. Basicamente, ele é uma série de instruções finitas que serão executadas pelos programas; o trabalho humano consiste em estabelecer essas instruções. Algoritmos de recomendação são um bom exemplo disso, já que costumam funcionar com base nas atividades do usuário. Se você marcou que gostou do filme de um diretor, por exemplo, provavelmente terá interesse em outros dele.

Análise preditiva

Modelos que utilizam análise preditiva tentam, de certa forma, prever o futuro. Pode parecer ficção científica, mas é isso mesmo. A partir da análise de dados, é possível traçar tendências de mercado ou perceber mudanças no comportamento das pessoas, por exemplo.

Big data

Como fica claro pelo próprio nome, a expressão big data é utilizada para se referir às grandes quantidades de informações que são produzidas e processadas na atualidade. Afinal de contas, é preciso ter dados armazenados em algum lugar antes de ser possível fazer uma análise e gerar resultados.

Uma calculadora.

Machine learning

Também pode ser chamada pelo nome em português, aprendizagem de máquina. Representa todo o conceito das máquinas capazes de utilizar algoritmos para analisar grandes quantidades de dados e aprender a executar tarefas, tomando decisões sem a necessidade de intervenção humana.

Mineração de dados

Também conhecida como data mining, a mineração de dados nada mais é que o processo de encontrar padrões na big data. Cabe ao profissional empregar as ferramentas corretas para observá-los e, com base nesse conhecimento, tirar conclusões que possam ser utilizadas para desenvolver novas estratégias.

Python

Uma linguagem de programação muito utilizada por cientista de dados. Ela égeralmente elogiada por sua simplicidade, que a faz ser aprendida facilmente por iniciantes na área, mas também oferece um leque de opções avançadas para profissionais mais experientes. É uma ferramenta essencial que costuma ser apresentada logo no início dos estudos de data science.

Apesar de tudo, ingressar nessa área não precisa ser difícil ou caro. A plataforma de ensino Udacity, por exemplo, oferece a Trilha de Dados, Data Science e Machine Learning, com cursos completos de ciência de dados.

O planejamento pode ser todo adequado ao perfil profissional desejado, com explicações didáticas sobre as diferenças entre as opções. É um bom ponto de partida para uma futura carreira em data science.