O termo do momento em tecnologia analítica é Machine Learning. Ontem foi Big Data. Antes disso Data Warehouse, e amanhã o que será? Por incrível que pareça, a era da informação passou e muitos ainda não perceberam. Estamos na era da inteligência.
Com hardwares cada vez mais baratos, capacidades de processamento e armazenamento ainda maiores, pessoas e coisas cada vez mais conectadas e regiões se tornando globais, muitas empresas já começaram a armazenar todo tipo de dado com a expectativa de obter valor no futuro. Algumas já foram além e fazem streaming de dados antes mesmo de armazená-los. E não é com surpresa que aparece a dúvida de como melhor aproveitar esse cenário. É exatamente um dos aspectos do uso de dados que gostaria de explorar aqui, a construção de arquétipos.
Utilizar os dados com inteligência, através de mecanismos automáticos como Machine Learning, é algo que já existe há bastante tempo. Soluções de prevenção à fraude com machine learning existem desde a década de noventa, ou seja, desde o século passado. E o que mudou? Mudaram as tecnologias utilizadas em machine learning. E algumas delas se baseiam no sistema de Inferência Bayesiana (Bayesian Learning). O método Bayesian learning estuda as mudanças de comportamento dos usuários por meio da simbologia, isto quer dizer que cada ação realizada será nomeada por um conjunto de símbolos, que juntos, permitem criar hipóteses sobre a probabilidade de comportamento, que serão encaixadas dentro de arquétipos.
De forma simplificada, isso nos permite armazenar informação e não simplesmente dados. Muito semelhante à Psicología Analítica, porém ao revés. Imagine poder identificar nos diversos eventos colecionados em suas bases de dados ou interceptados por seus sistemas, estruturas comuns e primordiais dotadas de significado, que pudessem ser representadas por alguns simbolos. Essas estruturas chamamos de arquétipos. Digo aqui ao revés porque partimos dos eventos para chegar nos arquétipos e na Psicologia são os fenômenos (ou eventos) que se moldam aos arquétipos.
Estas técnicas permitem às diversas indústrias conhecerem melhor seus clientes e com isso, ofertar produtos e serviços mais aderentes ao interesse de consumo de cada um. Como exemplo, muitos de nós já experimentaram sites de streaming de música ou vídeo oferecendo filmes ou músicas mais adequadas ao seu gosto ou sites de venda de produtos indicando novidades semelhantes a itens comprados ou consultados anteriormente. São essas técnicas que nos permitem identificar com alto grau de confiança a probabilidade de determinado evento ser uma fraude ou não.
Pessoas reais não são unidimensionais. Você não ouve apenas uma música, compra apenas um tipo de artigo ou utiliza apenas um meio de pagamento. Esta complexidade que torna nosso mundo singular e plural ao mesmo tempo nos desafia a identificar o comportamento através de dados multivariados. O uso de arquétipos tem resultado em reduções significativas de falso-positivos na prevenção à fraude.
Um alerta que gostaria de replicar encontrei na revista Pesquisa, da Fapesp, de abril de 2018. No artigo publicado por Bruno de Pietro, ele apresenta um gráfico comparando a quantidade de papers publicados sobre novos algoritmos (5000 em 2015) e a quantidade de papers sobre o comportamento dos algorítmos (em torno de 500 em 2015). Ou seja, muito do que vemos é boa teoria com pouca prática. Ou muitos fazendo com pouca experiência.
Para se utilizar Machine Learning é preciso saber olhar para o dado certo, com a pergunta certa, para aí sim automatizar o processo de aprendizado adequado. Portanto, fique atento como sua empresa tem trabalhado esse tema. E se você já está nisso há algum tempo, vale a pena olhar com cuidado o uso de arquétipos, o ganho é real e comprovado.
Em toda essa conversa de automação, a boa notícia é que para garantirmos um resultado de qualidade ainda precisamos ser humanos. Deixe os robôs trabalharem para você, e não por você, e seja feliz!
Ricardo Cheida, country manager da FICO no Brasil.
Só faltou estar em espanhol para ser serfeito! :o) Excelente texto.