Como probabilidades podem ser usadas em jogo 365 um campeonato de futebol?
O que nós
utilizamos em jogo 365 nosso programa?
Como podemos definir 🎅 a probabilidade de cada
evento?
Qual a diferença entre uma afirmação matematicamente verdadeira e uma
estatisticamente provável?
Será que 100% de chances 🎅 significa certeza do evento
ocorrer?
Como probabilidades podem ser usadas em jogo 365 um campeonato de futebol?
O
campeonato brasileiro, com jogo 365 atual 🎅 fórmula de dois turnos disputados por 20 equipes,
torna-se um excelente problema para se discutir probabilidades. Vale lembrar que são
🎅 dois turnos, cada um com 19 rodadas de 10 jogos. Assim, o campeonato completo tem 380
jogos. Se não nos 🎅 preocuparmos com saldo de gols, mas apenas em jogo 365 separar os
resultados em jogo 365 vitória, empate ou derrota, teremos 380 🎅 “sorteios” com três
alternativas cada. Isso dá um total de 3380 “campeonatos” diferentes.
A maioria das
pessoas têm dificuldade em jogo 365 🎅 imaginar este número. Por exemplo, normalmente as
pessoas consideram “muito grande” o número de grãos de areia em jogo 365 uma 🎅 praia. O
número de combinações de resultado possíveis no campeonato brasileiro é bem maior que
isso. Para se ter idéia, 🎅 o número de resultados possíveis em jogo 365 apenas uma rodada é
310 = 59.049, ou seja, se pedirmos para cada 🎅 pessoa guardar uma combinação possível,
precisaremos de toda o público de um clássico para dar conta de uma rodada.
Nesse mesmo
🎅 sistema (uma pessoa por combinação possível), usaremos toda a audiência de um final de
Copa do Mundo (metade da população 🎅 da Terra) para guardar todas as combinações
possíveis de duas rodadas: 320 combinações possíveis. Tentemos uma abordagem diferente.
Por exemplo, 🎅 cada átomo do seu corpo poderia guardar uma das combinações de resultados
(não pergunte como). Seu corpo tem da ordem 🎅 de 1026 átomos, que com um pouco mais de
boa vontade pode ser o suficiente para guardar os resultados de 🎅 cinco rodadas! E já que
começamos a usar os átomos para guardar os resultados possíveis, que tal usarmos todos
os 🎅 átomos do sistema solar? Podemos estimar que estes seriam suficientes para 12
rodadas do campeonato. Só por curiosidade, o número 🎅 3380 de combinações possíveis de
resultados é maior que 10180, ou seja, o número formado pelo algarismo 1 seguido por
🎅 180 zeros!
Se por um lado essa quantidade de resultados torna impossível considerá-las
individualmente, causa conforto saber que a relação entre 🎅 probabilidades e “o mundo
real” depende de um resultado matemático conhecido como Lei dos Grandes Números. A
grosso modo, não 🎅 adianta muito você saber que um dado de seis faces é honesto se ele
for lançado uma única vez. Ou 🎅 ainda, você não terá como saber se ele é ou não honesto
apenas com esse lançamento. Já se esse dado 🎅 for lançado um milhão de vezes, você sabe
de antemão que, se ele for honesto, a chance é imensa que 🎅 a quantidade de vezes que a
face quatro vai aparecer estará entre 160 mil e 170 mil. Se, por outro 🎅 lado, isso não
acontecer, é muito grande a chance que o dado não seja honesto.
Todos que gostam de
futebol devem 🎅 concordar que há uma diferença conceitual entre a loteria esportiva e
outras loterias numéricas (ou jogos com dados). Nas loterias 🎅 numéricas acreditamos que
todos os números envolvidos no sorteio são equiprováveis (têm a mesma chance de ser
sorteado). Já na 🎅 loteria esportiva, os jogos comumente têm favoritos e “zebras”, ou
seja, há uma distribuição desigual da probabilidade entre os possíveis 🎅 resultados. É
com este tipo de problema que nos deparamos ao tentar tratar o Campeonato Brasileiro de
Futebol probabilisticamente.
Nosso problema 🎅 é ainda um pouco mais complicado do que o
que já foi exposto. As probabilidades de cada resultado em jogo 365 🎅 cada jogo dependem de
muitos fatores, impossíveis de se levar em jogo 365 conta nos mínimos detalhes. Como
exemplos, temos o 🎅 estádio onde é disputada a partida, a temperatura no horário do jogo,
se chove ou não, os desfalques de cada 🎅 equipe, os resultados recentes dos times, a
situação de cada um no campeonato, o árbitro escalado para o confronto…
Finalizando,
temos 🎅 um número muito grande de possibilidades, cada uma delas tem uma probabilidade de
ocorrer. Para saber a chance de um 🎅 time ser campeão, devemos somar as probabilidades de
cada alternativa que dá o título a este time. Parece simples, mas 🎅 levando em jogo 365
consideração o número de alternativas discutido acima, esta estratégia se torna
inviável, exceto se fizermos muitas simplificações.
O 🎅 que nós utilizamos em jogo 365 nosso
programa?
Inúmeros fatores influenciam nas probabilidades de resultado de um jogo de
futebol. Assim, qualquer 🎅 modelo criado para simular o campeonato é necessariamente
super simplificado. E este é um dos aspectos mais fascinantes do problema 🎅 geral de
modelagem: como conseguir bem descrever uma situação complexa com modelos simples?
A
primeira grande simplificação que fazemos é que, 🎅 ao invés de nos preocuparmos em jogo 365
determinar todas as combinações possíveis de resultados, atribuimos probabilidades a
elas, para depois 🎅 somar as probabilidades dos casos favoráveis, fazemos um grande
número de simulações do campeonato. Feitas as simulações, contamos quantas terminaram
🎅 com o resultado favorável (tal time campeão ou tal time rebaixado…) e dividimos pelo
número total de simulações.
Duas perguntas são 🎅 naturais aí: onde entram as
probabilidades de cada jogo e até que ponto as probabilidades estimadas dessa maneira
são confiáveis?
As 🎅 probabilidades de cada jogo entram na ideia de simulação. A
simulação usa o sorteio de um número aleatório para definir 🎅 o vencedor de cada partida.
Este número aleatório é sorteado como um número positivo menor que, ou igual a, 1. 🎅 Se,
por algum motivo, consideramos que o mandante de um certo jogo (isso varia de jogo para
jogo, detalhes mais 🎅 abaixo) tem 45% de chance de vitória, 35% de chance de empate e 20%
de chance de derrota, vamos considerá-lo 🎅 vitorioso, nesta simulação, se o número
aleatório for menor que (ou igual a) 0,45, consideraremos o resultado como empate se 🎅 o
número estiver acima de 0,45 e abaixo de (ou igual a) 0,80 e consideraremos o resultado
de vitória do 🎅 visitante se aquele número aleatório estiver acima de 0,80. Sendo mais
geral, para cada partida, temos um número p<1 que 🎅 dá a probabilidade da vitória do
mandante, outro número q<1-p que dá a probabilidade do empate. Sorteamos um número
aleatório 🎅 x entre 0 e 1, se x≤p o mandante venceu este jogo nesta simulação; se p
p+q, o é considerado 🎅 empate; se x>p+q, o visitante é que venceu. Entendido como
simulamos o resultado de uma partida, basta dizermos que uma 🎅 rodada do Campeonato é
simulada fazendo as 10 partidas desta forma.
O problema agora é saber como determinar
os números p 🎅 e q que definem as probabilidades para cada jogo. Aqui entra a arte da
modelagem, citada acima. Se o Brasil 🎅 fosse o “país da matemática”, ao invés do “país do
futebol”, possivelmente diríamos que cada brasileiro é um modelador, assim 🎅 como dizemos
que cada brasileiro é um técnico de futebol. Existem infinitas maneiras de gerar estes
números p e q 🎅 e não é fácil decidir “qual a melhor maneira” (sequer é fácil decidir o
que significa “melhor”). Escolhemos uma, que 🎅 nos pareceu razoável. Com o passar do
tempo, fizemos algumas modificações. Queremos compará-la com várias outras
possibilidades, o que deve 🎅 ser feito no futuro. Algumas características de nossa
modelagem:
As probabilidades dependerão apenas da história das equipes dentro do
próprio campeonato; 🎅 O mando de campo é um fator importante, mas times diferentes reagem
de maneiras diferentes a este fator; Vencer uma 🎅 partida aumenta a probabilidade de
vencer outras; Perder aumenta a probabilidade de perder; Empatar aumenta a
probabilidade de empatar.
A primeira 🎅 é apenas um fator simplificador e destinado a
evitar “preconceitos” nossos, como tentar definir quanto “pesa a camisa” de cada 🎅 time
ou outros conceitos. De fato, isto não é verdade. A história anterior de cada clube, os
fatos recentes, os 🎅 desfalques, se ele disputa outras competições simultaneamente… tudo
isso “entra em jogo 365 campo”, mas se torna difícil de modelar. E 🎅 sempre é bom começarmos
por modelos simples. A segunda parece uma hipótese razoável, e encontramos uma maneira
simples de incluí-la 🎅 em jogo 365 nosso modelo. Já a terceira é apenas uma espécie de versão
futebolística de “o rio corre para o 🎅 mar”: times que vencem muito tornam-se
favoritos.
Vamos ao modelo. A cada rodada, cada time é descrito por dois trios de
🎅 números. Um trio representa seu perfil de mandante e o outro trio seu perfil de
visitante. Isoladamente, o trio de 🎅 números que descreve o perfil de mandante de um time
pode ser pensado como a jogo 365 tendência a vencer, empatar 🎅 ou perder jogos em jogo 365 casa.
Da mesma forma para seu perfil de visitante. Cada um desses números é positivo 🎅 e a soma
de cada trio é sempre 1. Quando o time A recebe o time B para jogar “em 🎅 jogo 365 casa”, o
número p que representa a probabilidade de vitória do mandante será inferido fazendo a
média aritmética entre 🎅 a tendência de vitória expressa pelo perfil de mandante de A e a
tendência de derrota do perfil de visitante 🎅 de B. De maneira análoga, obtém-se q
fazendo a média das tendências de empate. Pela propriedade de soma 1, estes 🎅 dois número
descrevem as probabilidades das três alternativas consideradas.
Uma característica
importante do nosso modelo é que, terminada a rodada, os 🎅 perfis dos times são
atualizados, de acordo com a hipótese 3 acima. O que fazemos é alterar o perfil de
🎅 mandante daqueles que jogaram como mandantes na rodada e o perfil de visitante dos
demais. Para isso, fazemos uma média 🎅 ponderada entre o perfil antes da rodada e o trio
de números que descreve o resultado (um para o resultado 🎅 ocorrido, zero para as outras
duas alternativas). Surge aí uma questão: quais pesos usar nesta média ponderada? É
natural que 🎅 o perfil anterior tenha um peso maior do que o resultado apenas do último
jogo. O quanto maior é uma 🎅 questão que não sabemos responder. Já usamos alguns valores
diferentes em jogo 365 nosso programa, e recentemente resolvemos incluir ainda o 🎅 desempenho
do adversário nesta conta. Vencer um adversário bom muda mais o perfil de um time do
que vencer um 🎅 adversário fraco. Da mesma forma, perder para um adversário fraco piora
mais o perfil do que perder para o líder 🎅 do campeonato.
Assim, começando com os dados
das rodadas já realizadas, obtemos os perfis de cada equipe e rodamos as simulações.
🎅 Atualmente, rodamos da ordem de um milhão de “campeonatos”, para determinar as
probabilidades exibidas nesta página. Como hipótese não tendenciosa 🎅 usamos inicialmente
o mesmo perfil para todos os times: 4-3-3, que aqui não é esquema tático, mas apenas
uma probabilidade 🎅 um pouco maior de vitória do mandante do que dos outros dois
resultados (estes números também foram escolhidos apenas por 🎅 simplicidade, e de fato
significam o trio [0.4, 0.3, 0.3]).
Como podemos definir a probabilidade de cada
evento?
Para essa pergunta, não 🎅 há uma resposta precisa. Há sempre uma grande
dependência em jogo 365 hipóteses que assumimos. Por exemplo, ao considerarmos que um 🎅 cara
ou coroa apresenta 50% de probabilidade para cada resultado, assumimos, por exemplo,
que a moeda nunca “pára de pé”. 🎅 Também assumimos que o lançamento e a própria
distribuição de material na moeda não “viciam” tal lançamento.
Qual a diferença entre
🎅 uma afirmação matematicamente verdadeira e uma estatisticamente provável?
A Matemática
tem um forte compromisso com a Lógica. Mantendo em jogo 365 mente 🎅 nosso exemplo de um
campeonato de futebol por pontos corridos, um time só pode ser dito matematicamente
livre do rebaixamento, 🎅 ou matematicamente classificado para a Libertadores, ou qualquer
outra expressão deste tipo, quando todas as combinações ainda possíveis àquela altura
🎅 do campeonato levam a esta mesma conclusão (o rebaixamento de tal time, ou a
classificação para a Libertadores de tal 🎅 outro).
Se quisermos ser ainda mais precisos
(e os matemáticos têm este hábito), devemos deixar claras algumas hipóteses assumidas
para que 🎅 seja verdade um fato do tipo “tal time está matematicamente rebaixado”. Por
exemplo, assumimos que nenhum time será punido por 🎅 alguma atitude irregular (utilização
ilegal de jogador, compra de árbitros…) com perda de pontos.
Mas como a cada rodada
ainda são 🎅 sempre muitas as possibilidades do campeonato, pode acontecer de um evento
ser extremamente provável (por exemplo, ter 99,9% de chances). 🎅 Tais eventos são ditos
estatisticamente prováveis. Quando o rebaixamento de um certo time é estatisticamente
provável, isso significa que muito 🎅 provavelmente ele vai cair sim, mas que “ainda há
esperanças”. Em jogo 365 geral, é o que fica conhecido como “só 🎅 uma improvável combinação
de resultados para salvar tal equipe”.
Um dos nossos objetivos ao criar esta página é
separar muito claramente 🎅 o que são fatos matemáticos e o que são possibilidades
estatísticas.
Será que 100% de chances significa certeza do evento ocorrer?
A 🎅 primeira
vista, um evento 100% provável acontece sempre e um evento com probabilidade zero nunca
acontece. Mas há uma sutileza 🎅 aí relacionada à quantidade de eventos possíveis. Em jogo 365
nossas tabelas, por exemplo, usamos percentuais de probabilidades com duas casas
🎅 decimais. Isso significa que só distinguimos as probabilidades de 0,001% em jogo 365
0,001%. Com isso, se obtivermos que as chances 🎅 de um time ser campeão são menores que
0,0005% (por exemplo, uma em jogo 365 um milhão), isso será representado em 🎅 jogo 365 nossa
tabela como 0,000%. Isso quer dizer que é estatisticamente improvável que esse time
seja campeão, mesmo que ainda 🎅 haja uma possibilidade matemática disto acontecer (para
mais detalhes, clique aqui). É claro que quando o time não tiver mais 🎅 possibilidade de
ser campeão (se faltando cinco rodadas ele estiver 20 pontos atrás do líder, por
exemplo) nossa tabela também 🎅 mostrará 0,000% de probabilidade para este time ser
campeão.