Atualmente, o cientista de dados é um dos profissionais mais requisitados no mercado de trabalho. Uma pesquisa feita pela Michael Page, líder mundial em recrutamento de executivos, aponta que os gestores de negócios em Business Intelligence e Big Data, juntamente com os cientistas de dados, serão os especialistas mais procurados no segmento de Tecnologia da Informação nos próximos dois anos, com salários variando entre R$ 12 mil e R$ 30 mil.
A procura crescente por esse especialista deve-se em parte pela grande popularidade que a subárea da Inteligência Artificial, chamada de Aprendizagem de Máquina (Machine Learning em inglês), ganhou nos últimos anos. Uma pesquisa feita pela MIT Technology Review e pela Google Cloud, publicada em março de 2017, indica que 26% das empresas entrevistadas planejam alocar mais de 15% do seu orçamento no setor.
Associado a isso, como a área de Big Data está em foco na indústria de tecnologia, Machine Learning tornou-se essencial por permitir que se façam previsões com base em grandes volumes de dados.
Dentre os exemplos mais comuns de Machine Learning estão: os algoritmos da Netflix que fazem sugestões de filmes de acordo com as preferências do espectador, os algoritmos da Amazon que recomendam livros com base nas últimas compras do usuário e os algoritmos adotados pelo Facebook que analisam atualizações de status para definir o conteúdo do seu feed.
O cientista de dados deve aplicar princípios, processos e técnicas para criar soluções inteligentes para problemas de negócios por meio da análise automática de informações. Para tanto, é preciso possuir sólidos conhecimentos em:
- Machine Learning: é uma subárea da Inteligência Artificial baseada em algoritmos matemáticos e sua automação, permitindo que uma máquina aprenda e/ou aperfeiçoe o seu desempenho em alguma tarefa. Os principais algoritmos envolvidos no processo são: árvore de decisão, redes neurais artificiais, técnicas de agrupamento e associação de dados, regressão linear e regressão logística.
- Sistemas de programação como Python, R, Scala ou o conhecimento de linguagens de consulta e tecnologias associadas como SQL, MySQL, PostgreSQL, Cassandra, MongoDB são fundamentais. Além disso, é importante saber trabalhar com bibliotecas e ferramentas de Machine Learning, tais como RapidMiner, TensorFlow, Power BI e Anaconda. Para o Big Data é essencial ter familiaridade com o Hadoop, MapReduce, Spark, Pig e Hive, por exemplo.
- Visualização: o foco aqui é o Visual Analytics, ou seja, a representação apropriada de dados complexos por meio de imagens e gráficos para facilitar o desenvolvimento de análises. É importante conhecer algumas das ferramentas como D3, Tableau e Qlikview.
Embora seja uma discussão atual, ainda não existe curso de graduação em Ciência de Dados. Assim, aos que desejam investir na área, é recomendado que procurem por cursos que contemplem e tenham em suas estruturas curriculares uma linha de formação voltada ao setor, com disciplinas como: Estatística, Análise Exploratória de Dados, Inteligência Artificial, Mineração de Dados ou Data Mining, Machine Learning, Banco de Dados estruturados e não estruturados, Desempenho de Negócio e Big Data.
A capacitação pode ser realizada na pós-graduação, em que há um grande número de cursos lato sensu e MBA que contribui para a formação dos cientistas de dados, bem como programas de pós-graduação stricto sensu, como um mestrado ou doutorado. O caminho para se tornar um especialista envolve uma jornada de estudos e programas de formação, além do uso da Metodologia de Pesquisa aplicada na análise e solução de problemas reais.
*Ana Cristina Santos é coordenadora do curso de Pós-Graduação em Business Intelligence com Big Data da Faculdade Impacta
Leia nesta edição:
CAPA | TECNOLOGIA
Centros de Dados privados ainda geram bons negócios
TENDÊNCIA
Processadores ganham centralidade com IA
TIC APLICADA
Digitalização do canteiro de obras
Esta você só vai ler na versão digital
TECNOLOGIA
A tecnologia RFID está madura, mas há espaço para crescimento
Baixe o nosso aplicativo