Cientista de dados: uma carreira de futuro

0
0

Todos os dias enviamos mensagens, áudios, postamos fotos ou compartilhamos vídeos nas redes sociais, realizamos algum pagamento ou acessamos algo na web, vamos de um lugar ao outro com nossos celulares no bolso e compartilhamos nossas localizações. Deixamos rastros e pistas daquilo que gostamos ou não gostamos, com quem falamos e muitas vezes sobre o que realmente pensamos. Cada uma dessas situações é registrada em algum tipo de base de dados, formando aquilo que chamamos de "Big data". O ponto é que, se devidamente analisado, o conteúdo do big data pode ajudar a entender a forma como agimos, do que gostamos e o que queremos ou precisamos.

Para tirar insights de big data existem alguns desafios: o primeiro é que a maior parte dele é composta por dados não estruturados como textos, mensagens, comentários, opiniões em redes sociais, áudios, fotos, vídeos, ligações e conversas, ou seja, são dados diferentes daqueles classificados em uma tabela e com os quais realizamos uma contagem ou tiramos uma média. Em seguida, como desafio, está a rápida velocidade de criação destes dados, o imenso volume deles, sua imensa variedade, além da importância da checagem pela veracidade.

Todos esses fatores demandaram o surgimento de uma nova carreira: a profissão do cientista de dados, que é exatamente aquela pessoa que consegue carregar, preparar, analisar, modelar e extrair algum tipo de relação ou tendência oculta nestas montanhas de informações. Para fazer essa análise ele se vale de um conjunto de conhecimentos de diversas áreas, sendo minimamente três os requisitos desejados:

1.       Conhecer o máximo que puder a vasta disciplina de estatística, que é o pilar de todas as análises, pois com ela o cientista de dados entende a natureza e descreve as informações, determina o tipo de abordagem a ser utilizada e se vale de diversos métodos, algoritmos e modelos para realizar a análise.

2.       Entender muito de aspectos de computação tais como linguagens open source R, Python, Scala de forma que ele possa criar meios de ingerir e trabalhar os dados em sistemas (sejam estes dados estruturados ou não) e realizar as análises estatísticas e computacionais, tais como os algoritmos de máquinas de aprendizagem. Nesta etapa também temos aspectos bem tecnológicos de como acessar ambientes de big data como o Hadoop, de processamento como Spark, em plataformas como o Anaconda ou Watson Studio e posteriormente de como implementar os modelos de forma a torná-los úteis para as áreas de negócio.

3.       Ter conhecimento de negócios de forma que consiga realizar as análises com o contexto adequado a área ou a empresa em que está inserido e conseguir conversar de forma mais profunda com os analistas de negócios, direcionando a busca por conhecimento de uma forma realmente útil e prática.

Isso nos mostra que esta é uma carreira extremamente desafiadora, que demanda muito esforço e atualização, pois a tecnologia muda a cada dia e surgem novas formas de análise, novos algoritmos e máquinas de aprendizagem, além de novos ambientes de processamento sejam em CPU's (unidades de processamento central) ou GPU's (unidades de processamento gráfico). Além disso, o ideal é que o cientista de dados ainda seja uma pessoa curiosa e comunicativa, capaz de vender suas ideias, contar histórias e apresentar os conhecimentos e modelos obtidos de tal maneira que todos compreendam e aceitem adotar suas descobertas.

O cientista de dados também tem um importante papel ao ser capaz de realizar a eliminação de vieses dos modelos desenvolvidos pela inteligência artificial de forma a diminuir ao longo do tempo fatores discriminatórios sociais, raciais ou ideológicos, auxiliando a tornar nossa sociedade mais justa. Isto é amplamente tratado no projeto AIFairness360.

Não é fácil ser cientista de dados e não existe, atualmente, uma graduação que prepare as pessoas para essa profissão, pois esta é uma das novíssimas ocupações – que chegaram ao mercado há mais ou menos seis anos – trazidas pelas novas tecnologias e pela transformação digital. O espaço para esse profissional é imenso, já que as empresas precisam analisar seus dados e enriquecê-los para melhorar o poder preditivo de seus modelos. A tendência é de que cada área de uma empresa tenha seu profissional deste setor. Porém, como existem poucos com os skills para tamanha demanda, em geral são formadas células, ou seja, grupos de inteligência que atuam em várias áreas conforme relevância e retorno dos projetos.

Segundo levantamento da IDC, a América Latina terá uma escassez de mais de 550 mil profissionais de TI em 2019, principalmente em novas tecnologias (nuvem, segurança cibernética, inteligência artificial, redes etc). Com isso, fica cada vez mais evidente a necessidade das empresas e das universidades em andarem de mãos dadas e potencializarem seus papeis. Existe a necessidade evidente das escolas, universidades, empresas e todas as organizações investirem na transformação e desenvolvimento desses novos profissionais.

Portanto, tendo em vista estes pontos, podemos dizer que a carreira de cientista de dados está em plena ascensão graças a uma imensa procura por profissionais que realmente dominem o tema e que sejam capazes de extrair os insights que tornarão suas empresas mais justas, competitivas e com melhores resultados.

Claudio Pinheiro, cientista de dados sênior da IBM Brasil.

Deixe seu comentário