Alguns aspectos são sempre esquecidos, ou até mesmo ignorados, em implementações de setores da tecnologia. Em uma área de Data Science não seria diferente.
Portanto, cito alguns aspectos que são fundamentais:
Valor
O objetivo de um modelo é sempre gerar valor para o negócio, portanto, a busca por uma fórmula perfeita, pode não ser a melhor solução. Tenha sempre em mente: errar rápido para aprender rápido. Garanta que as métricas do modelo estão alinhadas com os indicadores de negócio para que seja fácil a visibilidade do retorno do investimento.
Acesso
A companhia deve deixar todos os dados acessíveis, que sejam necessários, para que os engenheiros de dados e cientistas de dados possam trabalhar. Parece óbvio, mas em muitas empresas, os dados estão dispostos em silos, fazendo com que apenas uma determinada área, ou até mesmo, poucas pessoas tenham acesso. Todas as variáveis precisam ser explícitas, caso contrário, não há modelo que se sustente. Não é possível se esquecer da governança de dados, privacidade e segurança (porém, esses pontos valem outro artigo para uma nova discussão). O fato é: ter acesso aos dados para que os engenheiros e cientistas possam trabalhar.
Operação
Os processos devem ser automatizados ao máximo para ganhar agilidade. Hoje, já temos diversas ferramentas de automação de processos e novas soluções surgem a todo momento. Recentemente, o Google em seu evento Google I/O, lançou o Vertex AI, uma plataforma para criar fluxos de trabalho de Machine Learning completos. Operacionalizar um modelo não é somente desenvolver: como qualquer outro produto de tecnologia, dever ser mantido, observado e principalmente deve estar disponível.
Portanto toda a estrutura Ops deve ser lembrada – DataOps (Gerenciamento de Pipelines e Workflows de Dados), ModelOps (Governança e Gerenciamento do ciclo de vida de AI e Modelos) e DevOps.
Luis Bannwart, head de Data Science na ART IT.