Machine Learning, ou em nosso bom português: aprendizado de máquina, é o que permite às casas de apostas traçarem as 🧾 odds – ou cotações – que você vê sempre ao abrir um site de qualquer uma delas.
Talvez você tenha a 🧾 impressão de que isso seja coisa de asiático do Vale do Silício, mas aplicar o aprendizado de máquinas nas apostas 🧾 e no futebol está cada vez mais acessível, e talvez esse artigo seja o divisor de águas para um fantástico 🧾 aprendizado que você jamais imaginou ter.
E o que é esse tal de Machine Learning ou Aprendizado de máquina?
Se você buscar 🧾 na Wikipedia por alguma explicação mais formal, teremos algo mais ou menos assim:
É a capacidade dos computadores aprenderem e tomarem 🧾 decisões sem que sejam exatamente programados para isso.
Aprende-se através dos exemplos, ponderando erros e acertos através de algoritmos matemáticos.
Vejam que 🧾 eu sapequei um negrito em "aprende-se através dos exemplos", porque é justamente através da quantidade de exemplos, ou da quantidade 🧾 de amostras que oferecemos ao algoritmo de aprendizagem de máquina que ele conseguirá de fato aprender alguma coisa.
Um exemplo idiota 🧾 de aprendizado de máquina
Nada melhor do que um exemplo, daqueles bem imbecis mesmo, para que isso fique muito claro.
Vamos dizer 🧾 que eu queira fazer uma previsão classificatória e, portanto, quero prever se uma coisa pode ser:
O nosso simpático designer, o 🧾 Markin;
Uma garrafa de cerveja;Ou uma vaca.
Para fazer essa previsão eu preciso trazer centenas ou mesmo milhares de exemplos de Markinhos, 🧾 de garrafas de cervejas e de vacas.
E quanto mais características relevantes eu conseguir trazer em meus exemplos, melhor será o 🧾 meu modelo de aprendizado de máquina.
As variáveis no aprendizado de máquina: nº de patas, muge?
Vamos dizer que eu, com toda 🧾 minha incompetência, somente consiga trazer duas variáveis:
Quantidade de patas;Muge?
Portanto, temos aí uma variável numérica discreta que é a quantidade de 🧾 patas, e uma variável binária que tem esse nome porque só assume dois valores: 0 para não, e 1 para 🧾 sim.
Veja só, como ficaria o nosso conjunto de dados que estamos usando para treinar o nosso modelo:
Maravilha! Depois de ter 🧾 mostrado para o nosso algoritmo uma caralhada de Markinhos, de Garrafas de Cerveja e de Vacas, o modelo vai conseguir 🧾 achar um padrão através das variáveis e daí, ao ver uma "nova coisa" como essa:
Ele dirá: "Ahá! Saporra aqui é 🧾 uma vaca! Com 99,99% de certeza!" E veja que para chegar a tal decisão foi usado um algoritmo muito utilizado 🧾 em aprendizado de máquina: uma árvore de decisão.
Os algoritmos são as ferramentas para a solução de problemas
A árvore de decisão 🧾 é um algoritmo porque ela é um conjunto de regras e de operações lógicas e matemáticas que nos permite resolver 🧾 um determinado problema.
Em outras palavras, algoritmos são como ferramentas, e você precisará buscar a melhor ferramenta para um determinado problema.
Um 🧾 martelo pode ser ótimo para bater um prego, mas uma merda para coar um cafézinho.
Assim, a árvore de decisão foi 🧾 fazendo perguntas para cada uma das variáveis e, dependendo das respostas, uma diferente classificação é dada para essa coisa nova 🧾 que até então não havia classificação alguma.
Aprendizado de máquina nas apostas de futebol
Essa é a hora que você deve se 🧾 perguntar:
Tá bom! Mas o que caralhos o Markinho, ou a cerveja ou a vaca tem a ver com Machine Learning 🧾 nas apostas em futebol?
E a resposta é simples: em nosso problema anterior, o nosso desafio era classificar novas coisas em 🧾 três categorias, que eram o Markinho, a garrafa de cerveja e uma vaca.
Agora, enquanto apostadores, o nosso desafio poderá ser 🧾 classificar uma partida que irá acontecer entre:Mandante;Empate;Visitante.
Ou, mesmo, se a partida terá mais ou menos de 2.
5 gols, ou ainda 🧾 se um determinado Handicap vai bater.
E mais importante que isso: calcular as probabilidades de cada uma dessas classificações, porque uma 🧾 vez que a gente tem as probabilidades a gente consegue convertê-la em odds, e ao convertê-la em odds nós sabemos 🧾 se uma aposta tem ou não valor esperado positivo.
As variáveis em aprendizado de máquina no futebol
Existe um campo de estudo 🧾 na ciência de dados chamado 'Feature Engineering', a tradução para português fica bem ruim: engenharia de recursos.
Assim, entenda Feature Engineering 🧾 como a casa de apoata com capacidade de adquirir e elaborar novas variáveis para o seu modelo de aprendizado de máquina.
Assim, para criar 🧾 um modelo para prever o resultado de uma partida de futebol ter variáveis como:Nº de patasMuge?
Não tem nenhum valor! Porque 🧾 essas variáveis não nos ajuda em nada em nosso novo problema.
No futebol, fazer uma análise preditiva requer mais variáveis e 🧾 também exige uma complexidade maior para obtê-las.
No início de 2019, nós aqui do Clube fizemos um processo seletivo para contratar 🧾 um novo cientista de dados.
Veja só como era o conjunto de dados utilizado para treinar o modelo de aprendizado de 🧾 máquina que utilizamos como desafio nesse processo seletivo.
Vou trazer um exemplo das 5 primeiras linhas:
Um exemplo de um conjunto de 🧾 dados utilizado para aprendizagem de máquina no futebol
Esse conjunto possuia 30 variáveis, que são elas:
'home_name': Nome do mandante,
'away_name': Nome do 🧾 visitante,
'home_score': Gols feitos pelo mandante na partida,
'away_score': Gols feitos pelo visitante na partida,
'final_result': Essa é a variável que queremos prever, 🧾 trata-se do resultado final, sendo H (Home) Vitória do Mandante, D (Draw) Empate, e, por fim, A (Away) visitante,
'time': Tempo 🧾 em formato unix,
'home_pos': A posição do mandante antes dessa partida,
'away_pos': A posição do visitante antes dessa partida,
'round': A rodada do 🧾 campeonato,
'home_last5all_home': Saldo de gols do mandante nas últimas 5 partidas,
'home_last5all_home_win': Nº de vitórias do mandante nas últimas 5 partidas,
'home_last5all_home_draw': Nº 🧾 de empates do mandante nas últimas 5 partidas,
'home_last5all_home_lose': Nº de derrotas do mandante nas últimas 5 partidas,
'away_last5all_away': Saldo de gols 🧾 do visitante nas últimas 5 partidas,
'away_last5all_away_win': Nº de vitórias do visitante nas últimas 5 partidas,
'away_last5all_away_draw': Nº de empates do visitante 🧾 nas últimas 5 partidas,
'away_last5all_away_lose': Nº de derrotas do visitante nas últimas 5 partidas,
'last5all_home_away_dif': A diferença do saldo entre as equipes, 🧾 ou seja: 'home_last5all_home' – 'away_last5all_away'
'fifa_home_ova': Score Geral do Mandante no Fifa
'fifa_home_att': Score de ataque do Mandante no Fifa
'fifa_home_mid': Score de 🧾 meio de campo do Mandante no Fifa
'fifa_home_def': Score de defesa do Mandante no Fifa
'fifa_away_ova': Score Geral do Visitante no Fifa
'fifa_away_att': 🧾 Score de ataque do Visitante no Fifa
'fifa_away_mid': Score de meio de campo do Visitante no Fifa
'fifa_away_def': Score de defesa do 🧾 Visitante no Fifa
'elo_home_score': Score Elo do Mandante
'elo_away_score': Score Elo do Visitante
'tfm_value_home': Valor de mercado do elenco mandante em Euros
'tfm_value_away': Valor 🧾 de mercado do elenco visitante em Euros
A casa de apoata com capacidade e criatividade de conseguir criar e construir boas variáveis será fundamental 🧾 para sucesso do seu modelo de aprendizado de máquina nas apostas esportivas.
Um exemplo interessante, foi uma das postagens do Blog 🧾 da Pinnacle, onde diziam que há algumas décadas atrás alguns apostadores começaram a ter uma vantagem competitiva sobre as casas 🧾 porque havia inserido a variável 'condições climáticas' ao seu modelo.
Entretanto, logo as casas se atualizaram, inserindo essa variável também e 🧾 eliminando essa vantagem que havia sido conquistada.
Por quê você deveria estudar Machine Learning como apostador?
Você provavelmente já deve ter percebido 🧾 que para se aventura na área do aprendizado de máquina ou mesmo da ciência de dados como um todo você 🧾 vai precisar aprender uma linguagem de programação.
Atualmente, as mais recomendadas pela comunidade são:PythonR
E vem justamente daí a maior vantagem nesse 🧾 caminho: ainda que você não consiga bons resultados a caminhada valerá a pena.
Aprender programação é útil para a vida
Se você 🧾 dedica anos da casa de apoata com vida para estudar o trading esportivo, operar softwares como GeeksToy, entender resistências, peso do dinheiro, time 🧾 bombs, momentos de jogo, entre outros conceitos do trading esportivo; dificilmente você conseguirá transportar esse conhecimento para outras áreas da 🧾 vida caso você fracasse em tornar-se um trader lucrativo.
Entretanto, esse problema não ocorre aqui.
Porque o que você irá aprender em 🧾 Python, que é a linguagem que utilizamos e recomendamos, assim como todo o conhecimento de aprendizado de máquina, podem ser 🧾 aplicados em diversas área da casa de apoata com vida, seja ela pessoal ou mesmo profissional.
Certa vez, o meu grande amigo 'Japa' me 🧾 disse algo que concordo muito: 'a programação é o novo inglês'.
Assim, se antes precisávamos do inglês para nos destacar profissionalmente, 🧾 o mesmo já está acontecendo com a programação que também é uma linguagem.
É você aprendendo uma forma de falar com 🧾 o seu computador o que fazer.
Lembre-se: isso não é coisa de asiático do Vale do Silício, programação é acessível a 🧾 todos e aprendê-la no contexto das apostas esportivas é muito prazeroso.
Angústia de estar perdendo tempo
Como um reforço do argumento anterior, 🧾 é angustiante dedicar seu tempo a estudar algo que talvez não te traga os retornos que você deseja.
E volto a 🧾 repetir: ainda que você não consiga ganhar um centavo sequer com as apostas esportivas através dos seus modelos a caminhada 🧾 do aprendizado terá valido a pena.
Afinal, você aprendeu uma habilidade que é tida como essencial para o século que vamos 🧾 enfrentar.
Você dificilmente vai quebrar uma banca
Ao criar um modelo e, em seguida, automatizá-lo, você só vai quebrar a casa de apoata com banca 🧾 se você for, com o perdão da palavra, um retardado.
Ou então se você tiver feito alguma cagada que permitiu ao 🧾 seu programa – muito provavelmente por algum bug – apostar além do percentual que você definiu.
Além disso, ao treinar um 🧾 modelo de aprendizado de máquina você vai dividi-lo em dois conjuntos de dados:
Training Set: conjunto de treino;
Test Set: conjunto de 🧾 testes.
Assim, adivinhe só: você poderá simular os ganhos do seu modelo no conjunto de testes, que é um conjunto que 🧾 nunca foi visto pelo modelo, portanto é algo inédito, completamente novo.
Se você teve os devidos cuidados em evitar o Overfitting 🧾 dos dados, ou sobre-ajuste, esse modelo irá ter performance semelhante nos dados novos que virão.
Programar é dar uma série de 🧾 instruções lógicas para o seu computador, e ele as seguirá linha a linha.
Assim, veja que coisa maravilhosa: o seu computador 🧾 não vai querer apostar toda a casa de apoata com banca só porque o Mengão vai jogar contra um Fluminense desfalcado.
A frieza lógica 🧾 dos computadores fica ao nosso favor, não há emocional, não há coração, mas tão somente a objetividade crua daquilo que 🧾 foi programado por você mesmo.
Quer aprender Machine Learning aplicado às apostas no futebol?
Gostou? Então aproveite que esse ano, em parceria 🧾 com a casa de apostas Pinnacle, vamos fazer um treinamento avançado completo em Punting, e nós vamos ensinar você a 🧾 programar em Python, analisar dados, montar os seus conjuntos de dados para treinar seu modelo e fazer previsões para partidas 🧾 de futebol.
Clique no banner abaixo e saiba mais sobre o nosso Curso de apostas Punting avançado:
Além disso, para quem quer 🧾 se aprofundar nessa área, deixo as seguintes sugestões:
Kaggle: Comunidade de cientistas de dados, com desafios, fórum, cursos e discussões.
Comunidade de 🧾 cientistas de dados, com desafios, fórum, cursos e discussões.
Datacamp : um dos melhores portais de cursos de Ciência de dados 🧾 que já conheci;
: um dos melhores portais de cursos de Ciência de dados que já conheci; Quora : é o 🧾 Yahoo Respostas que deu certo.
Discussões de altíssimo nível são feitas por lá.
: é o Yahoo Respostas que deu certo.
Discussões de 🧾 altíssimo nível são feitas por lá.
Blog da Pinnacle: é o melhor blog de conteúdo analítico voltado para as apostas esportivas.
Vou 🧾 ficando por aqui.
Nos vemos em nosso curso! ;)