Alguns setores sempre estiveram à frente de outros quando o assunto é a análise de dados. Um deles é o de apostas. Durante vários anos, cálculos numéricos e previsões inteligentes, tanto online quanto nas ruas, deram às casas de apostas condições de prever diversas ocorrências, desde o final da Copa do Mundo até o sexo do bebê da família real inglesa. O uso de dados possibilitou o lançamento de apostas com base em variáveis obscuras, como o primeiro escanteio no futebol ou o número de corridas em um over específico no críquete.
A quantidade desses dados tem crescido rapidamente. Agora, para cada jogador em determinado time existe um grande volume de dados sendo gerados, dados esses que podem ser usados na criação de projeções. As casas de apostas estão utilizando técnicas de modelagem de previsões usando esse crescente conjunto de dados, com o fim de oferecer mais oportunidades aos apostadores. Eu contei 328 opções para um único jogo em um site de apostas on-line da Copa do Mundo. Um dos maiores desafios é fazer isso rapidamente, para que as probabilidades mudem em tempo real e os apostadores possam lançar seus palpites em qualquer estágio de um jogo.
A má notícia é que para as casas de apostas, a tecnologia do big data está democratizando a capacidade de ‘prever’. Empresas que usam o big data para ajudar os apostadores a ‘passar por cima’ das agências já estão surgindo. O Betegy, por exemplo, alega que pode prever os resultados de 90% de todas as partidas da primeira divisão do campeonato inglês de futebol por meio de um algoritmo complexo que analisa todos os fatores que podem interferir em um jogo – desde informações básicas, como a média de gols, até fatores complexos, como clima e motivação.
Ele faz a seguinte pergunta: em quanto tempo os torcedores obcecados por dados superarão as casas de apostas com seu próprio algoritmo? O big data pode acabar com o negócio de apostas? A tecnologia do big data é, em grande parte, gratuita. O Hadoop, a principal tecnologia baseada em big data, é uma tecnologia de código aberto, assim como a “R”, uma tecnologia de análise de dados preditiva, o que significa que ambas podem ser baixadas gratuitamente. Considerando que é possível comprar um desktop com 1 terabyte de memória por cerca de R$ 1700, posso conseguir tudo que é necessário para construir modelos bem sofisticados. Podemos usar técnicas avançadas, como redes neurais, nas quais inserimos várias estatísticas e resultados conhecidos. Posteriormente, o software cria modelos “mais adequados” com base em todos os dados disponíveis, que superam o “especialista” 9 vezes em 10 – e provavelmente as casas de apostas, com bastante frequência.
Um dos meus exemplos favoritos do rapaz comum que supera os profissionais usando dados é contado no filme O Homem que Mudou o Jogo (Moneyball, no original em Inglês), de 2011. Essa é a história real de Bill Beane, diretor do time de baseball Oakland Athletic , interpretado por Brad Pitt, e de como ele usou as estatísticas sobre os jogadores para criar uma equipe vencedora com um terço do orçamento dos times principais. Hoje existe uma imensidão de dados de jogos e desempenho disponíveis para uma série de esportes internacionais, que, quando analisados, podem nos ajudar a decidir qual será o time de futebol dos nossos sonhos. Ou a escolher um campeão na corrida de cavalos de Epson, por exemplo.
Os especialistas do futebol dirão que os modelos não podem superar o conhecimento do jogo e outros fatores, inclusive quem está em forma, a estratégia do time e as influências das diversas histórias de vestiário. A mesma afirmação era válida para o Departamento de Polícia de Los Angeles. Os policiais nunca acreditaram que um computador poderia lhes dizer como fazer seu trabalho. Mas quando usaram a tecnologia originalmente criada para elaborar modelos matemáticos de previsão de terremotos, para prever possíveis cenas de crimes, foi provado que eles estavam errados. Direcionando os policiais às cenas de crime previstas, houve uma redução de 33% no número de assaltos, 21% nos crimes violentos e 12% nos crimes contra a propriedade.
Assim, se você é um especialista em computação e sabe usar um software de análise de dados a seu favor, vale a pena começar a agir. Em vez de olhar para os resultados de apostas mais tradicionais, tais como os times vencedores e o número de gols, existe um grande espaço para apostas em resultados mais complexos usando um software de análise de dados para previsões.
O objetivo das casas de apostas é fornecer uma análise de todos os resultados o mais rápido possível. Para o resto de nós, alguns cautelosos, com baixo orçamento, a modelagem de big data que observa resultados específicos (como a sequência de gols, por exemplo), pode ser frutífera. Um bom começo seria observar onde os seus modelos geram resultados diferentes dos fornecidos pelas casas de apostas – deixando você um passo à frente para vencê-los no seu próprio jogo.
Como as casas apostariam na probabilidade dos analistas de dados de superar as previsões delas? Vale a pena apostar nisso. Se isso começar a acontecer, acredito que veremos uma mudança, chegando a um ponto em que as probabilidades diminuirão para compensar o aumento da capacidade do homem médio de processar grandes quantidades de dados.
Richard Brown, diretor global de BIM e análise de dados da Capgemini