Como probabilidades podem ser usadas em baralho é jogo de azar um campeonato de futebol?
O que nós
utilizamos em baralho é jogo de azar nosso programa?
Como podemos definir 🧬 a probabilidade de cada
evento?
Qual a diferença entre uma afirmação matematicamente verdadeira e uma
estatisticamente provável?
Será que 100% de chances 🧬 significa certeza do evento
ocorrer?
Como probabilidades podem ser usadas em baralho é jogo de azar um campeonato de futebol?
O
campeonato brasileiro, com baralho é jogo de azar atual 🧬 fórmula de dois turnos disputados por 20 equipes,
torna-se um excelente problema para se discutir probabilidades. Vale lembrar que são
🧬 dois turnos, cada um com 19 rodadas de 10 jogos. Assim, o campeonato completo tem 380
jogos. Se não nos 🧬 preocuparmos com saldo de gols, mas apenas em baralho é jogo de azar separar os
resultados em baralho é jogo de azar vitória, empate ou derrota, teremos 380 🧬 “sorteios” com três
alternativas cada. Isso dá um total de 3380 “campeonatos” diferentes.
A maioria das
pessoas têm dificuldade em baralho é jogo de azar 🧬 imaginar este número. Por exemplo, normalmente as
pessoas consideram “muito grande” o número de grãos de areia em baralho é jogo de azar uma 🧬 praia. O
número de combinações de resultado possíveis no campeonato brasileiro é bem maior que
isso. Para se ter idéia, 🧬 o número de resultados possíveis em baralho é jogo de azar apenas uma rodada é
310 = 59.049, ou seja, se pedirmos para cada 🧬 pessoa guardar uma combinação possível,
precisaremos de toda o público de um clássico para dar conta de uma rodada.
Nesse mesmo
🧬 sistema (uma pessoa por combinação possível), usaremos toda a audiência de um final de
Copa do Mundo (metade da população 🧬 da Terra) para guardar todas as combinações
possíveis de duas rodadas: 320 combinações possíveis. Tentemos uma abordagem diferente.
Por exemplo, 🧬 cada átomo do seu corpo poderia guardar uma das combinações de resultados
(não pergunte como). Seu corpo tem da ordem 🧬 de 1026 átomos, que com um pouco mais de
boa vontade pode ser o suficiente para guardar os resultados de 🧬 cinco rodadas! E já que
começamos a usar os átomos para guardar os resultados possíveis, que tal usarmos todos
os 🧬 átomos do sistema solar? Podemos estimar que estes seriam suficientes para 12
rodadas do campeonato. Só por curiosidade, o número 🧬 3380 de combinações possíveis de
resultados é maior que 10180, ou seja, o número formado pelo algarismo 1 seguido por
🧬 180 zeros!
Se por um lado essa quantidade de resultados torna impossível considerá-las
individualmente, causa conforto saber que a relação entre 🧬 probabilidades e “o mundo
real” depende de um resultado matemático conhecido como Lei dos Grandes Números. A
grosso modo, não 🧬 adianta muito você saber que um dado de seis faces é honesto se ele
for lançado uma única vez. Ou 🧬 ainda, você não terá como saber se ele é ou não honesto
apenas com esse lançamento. Já se esse dado 🧬 for lançado um milhão de vezes, você sabe
de antemão que, se ele for honesto, a chance é imensa que 🧬 a quantidade de vezes que a
face quatro vai aparecer estará entre 160 mil e 170 mil. Se, por outro 🧬 lado, isso não
acontecer, é muito grande a chance que o dado não seja honesto.
Todos que gostam de
futebol devem 🧬 concordar que há uma diferença conceitual entre a loteria esportiva e
outras loterias numéricas (ou jogos com dados). Nas loterias 🧬 numéricas acreditamos que
todos os números envolvidos no sorteio são equiprováveis (têm a mesma chance de ser
sorteado). Já na 🧬 loteria esportiva, os jogos comumente têm favoritos e “zebras”, ou
seja, há uma distribuição desigual da probabilidade entre os possíveis 🧬 resultados. É
com este tipo de problema que nos deparamos ao tentar tratar o Campeonato Brasileiro de
Futebol probabilisticamente.
Nosso problema 🧬 é ainda um pouco mais complicado do que o
que já foi exposto. As probabilidades de cada resultado em baralho é jogo de azar 🧬 cada jogo dependem de
muitos fatores, impossíveis de se levar em baralho é jogo de azar conta nos mínimos detalhes. Como
exemplos, temos o 🧬 estádio onde é disputada a partida, a temperatura no horário do jogo,
se chove ou não, os desfalques de cada 🧬 equipe, os resultados recentes dos times, a
situação de cada um no campeonato, o árbitro escalado para o confronto…
Finalizando,
temos 🧬 um número muito grande de possibilidades, cada uma delas tem uma probabilidade de
ocorrer. Para saber a chance de um 🧬 time ser campeão, devemos somar as probabilidades de
cada alternativa que dá o título a este time. Parece simples, mas 🧬 levando em baralho é jogo de azar
consideração o número de alternativas discutido acima, esta estratégia se torna
inviável, exceto se fizermos muitas simplificações.
O 🧬 que nós utilizamos em baralho é jogo de azar nosso
programa?
Inúmeros fatores influenciam nas probabilidades de resultado de um jogo de
futebol. Assim, qualquer 🧬 modelo criado para simular o campeonato é necessariamente
super simplificado. E este é um dos aspectos mais fascinantes do problema 🧬 geral de
modelagem: como conseguir bem descrever uma situação complexa com modelos simples?
A
primeira grande simplificação que fazemos é que, 🧬 ao invés de nos preocuparmos em baralho é jogo de azar
determinar todas as combinações possíveis de resultados, atribuimos probabilidades a
elas, para depois 🧬 somar as probabilidades dos casos favoráveis, fazemos um grande
número de simulações do campeonato. Feitas as simulações, contamos quantas terminaram
🧬 com o resultado favorável (tal time campeão ou tal time rebaixado…) e dividimos pelo
número total de simulações.
Duas perguntas são 🧬 naturais aí: onde entram as
probabilidades de cada jogo e até que ponto as probabilidades estimadas dessa maneira
são confiáveis?
As 🧬 probabilidades de cada jogo entram na ideia de simulação. A
simulação usa o sorteio de um número aleatório para definir 🧬 o vencedor de cada partida.
Este número aleatório é sorteado como um número positivo menor que, ou igual a, 1. 🧬 Se,
por algum motivo, consideramos que o mandante de um certo jogo (isso varia de jogo para
jogo, detalhes mais 🧬 abaixo) tem 45% de chance de vitória, 35% de chance de empate e 20%
de chance de derrota, vamos considerá-lo 🧬 vitorioso, nesta simulação, se o número
aleatório for menor que (ou igual a) 0,45, consideraremos o resultado como empate se 🧬 o
número estiver acima de 0,45 e abaixo de (ou igual a) 0,80 e consideraremos o resultado
de vitória do 🧬 visitante se aquele número aleatório estiver acima de 0,80. Sendo mais
geral, para cada partida, temos um número p<1 que 🧬 dá a probabilidade da vitória do
mandante, outro número q<1-p que dá a probabilidade do empate. Sorteamos um número
aleatório 🧬 x entre 0 e 1, se x≤p o mandante venceu este jogo nesta simulação; se p
p+q, o é considerado 🧬 empate; se x>p+q, o visitante é que venceu. Entendido como
simulamos o resultado de uma partida, basta dizermos que uma 🧬 rodada do Campeonato é
simulada fazendo as 10 partidas desta forma.
O problema agora é saber como determinar
os números p 🧬 e q que definem as probabilidades para cada jogo. Aqui entra a arte da
modelagem, citada acima. Se o Brasil 🧬 fosse o “país da matemática”, ao invés do “país do
futebol”, possivelmente diríamos que cada brasileiro é um modelador, assim 🧬 como dizemos
que cada brasileiro é um técnico de futebol. Existem infinitas maneiras de gerar estes
números p e q 🧬 e não é fácil decidir “qual a melhor maneira” (sequer é fácil decidir o
que significa “melhor”). Escolhemos uma, que 🧬 nos pareceu razoável. Com o passar do
tempo, fizemos algumas modificações. Queremos compará-la com várias outras
possibilidades, o que deve 🧬 ser feito no futuro. Algumas características de nossa
modelagem:
As probabilidades dependerão apenas da história das equipes dentro do
próprio campeonato; 🧬 O mando de campo é um fator importante, mas times diferentes reagem
de maneiras diferentes a este fator; Vencer uma 🧬 partida aumenta a probabilidade de
vencer outras; Perder aumenta a probabilidade de perder; Empatar aumenta a
probabilidade de empatar.
A primeira 🧬 é apenas um fator simplificador e destinado a
evitar “preconceitos” nossos, como tentar definir quanto “pesa a camisa” de cada 🧬 time
ou outros conceitos. De fato, isto não é verdade. A história anterior de cada clube, os
fatos recentes, os 🧬 desfalques, se ele disputa outras competições simultaneamente… tudo
isso “entra em baralho é jogo de azar campo”, mas se torna difícil de modelar. E 🧬 sempre é bom começarmos
por modelos simples. A segunda parece uma hipótese razoável, e encontramos uma maneira
simples de incluí-la 🧬 em baralho é jogo de azar nosso modelo. Já a terceira é apenas uma espécie de versão
futebolística de “o rio corre para o 🧬 mar”: times que vencem muito tornam-se
favoritos.
Vamos ao modelo. A cada rodada, cada time é descrito por dois trios de
🧬 números. Um trio representa seu perfil de mandante e o outro trio seu perfil de
visitante. Isoladamente, o trio de 🧬 números que descreve o perfil de mandante de um time
pode ser pensado como a baralho é jogo de azar tendência a vencer, empatar 🧬 ou perder jogos em baralho é jogo de azar casa.
Da mesma forma para seu perfil de visitante. Cada um desses números é positivo 🧬 e a soma
de cada trio é sempre 1. Quando o time A recebe o time B para jogar “em 🧬 baralho é jogo de azar casa”, o
número p que representa a probabilidade de vitória do mandante será inferido fazendo a
média aritmética entre 🧬 a tendência de vitória expressa pelo perfil de mandante de A e a
tendência de derrota do perfil de visitante 🧬 de B. De maneira análoga, obtém-se q
fazendo a média das tendências de empate. Pela propriedade de soma 1, estes 🧬 dois número
descrevem as probabilidades das três alternativas consideradas.
Uma característica
importante do nosso modelo é que, terminada a rodada, os 🧬 perfis dos times são
atualizados, de acordo com a hipótese 3 acima. O que fazemos é alterar o perfil de
🧬 mandante daqueles que jogaram como mandantes na rodada e o perfil de visitante dos
demais. Para isso, fazemos uma média 🧬 ponderada entre o perfil antes da rodada e o trio
de números que descreve o resultado (um para o resultado 🧬 ocorrido, zero para as outras
duas alternativas). Surge aí uma questão: quais pesos usar nesta média ponderada? É
natural que 🧬 o perfil anterior tenha um peso maior do que o resultado apenas do último
jogo. O quanto maior é uma 🧬 questão que não sabemos responder. Já usamos alguns valores
diferentes em baralho é jogo de azar nosso programa, e recentemente resolvemos incluir ainda o 🧬 desempenho
do adversário nesta conta. Vencer um adversário bom muda mais o perfil de um time do
que vencer um 🧬 adversário fraco. Da mesma forma, perder para um adversário fraco piora
mais o perfil do que perder para o líder 🧬 do campeonato.
Assim, começando com os dados
das rodadas já realizadas, obtemos os perfis de cada equipe e rodamos as simulações.
🧬 Atualmente, rodamos da ordem de um milhão de “campeonatos”, para determinar as
probabilidades exibidas nesta página. Como hipótese não tendenciosa 🧬 usamos inicialmente
o mesmo perfil para todos os times: 4-3-3, que aqui não é esquema tático, mas apenas
uma probabilidade 🧬 um pouco maior de vitória do mandante do que dos outros dois
resultados (estes números também foram escolhidos apenas por 🧬 simplicidade, e de fato
significam o trio [0.4, 0.3, 0.3]).
Como podemos definir a probabilidade de cada
evento?
Para essa pergunta, não 🧬 há uma resposta precisa. Há sempre uma grande
dependência em baralho é jogo de azar hipóteses que assumimos. Por exemplo, ao considerarmos que um 🧬 cara
ou coroa apresenta 50% de probabilidade para cada resultado, assumimos, por exemplo,
que a moeda nunca “pára de pé”. 🧬 Também assumimos que o lançamento e a própria
distribuição de material na moeda não “viciam” tal lançamento.
Qual a diferença entre
🧬 uma afirmação matematicamente verdadeira e uma estatisticamente provável?
A Matemática
tem um forte compromisso com a Lógica. Mantendo em baralho é jogo de azar mente 🧬 nosso exemplo de um
campeonato de futebol por pontos corridos, um time só pode ser dito matematicamente
livre do rebaixamento, 🧬 ou matematicamente classificado para a Libertadores, ou qualquer
outra expressão deste tipo, quando todas as combinações ainda possíveis àquela altura
🧬 do campeonato levam a esta mesma conclusão (o rebaixamento de tal time, ou a
classificação para a Libertadores de tal 🧬 outro).
Se quisermos ser ainda mais precisos
(e os matemáticos têm este hábito), devemos deixar claras algumas hipóteses assumidas
para que 🧬 seja verdade um fato do tipo “tal time está matematicamente rebaixado”. Por
exemplo, assumimos que nenhum time será punido por 🧬 alguma atitude irregular (utilização
ilegal de jogador, compra de árbitros…) com perda de pontos.
Mas como a cada rodada
ainda são 🧬 sempre muitas as possibilidades do campeonato, pode acontecer de um evento
ser extremamente provável (por exemplo, ter 99,9% de chances). 🧬 Tais eventos são ditos
estatisticamente prováveis. Quando o rebaixamento de um certo time é estatisticamente
provável, isso significa que muito 🧬 provavelmente ele vai cair sim, mas que “ainda há
esperanças”. Em baralho é jogo de azar geral, é o que fica conhecido como “só 🧬 uma improvável combinação
de resultados para salvar tal equipe”.
Um dos nossos objetivos ao criar esta página é
separar muito claramente 🧬 o que são fatos matemáticos e o que são possibilidades
estatísticas.
Será que 100% de chances significa certeza do evento ocorrer?
A 🧬 primeira
vista, um evento 100% provável acontece sempre e um evento com probabilidade zero nunca
acontece. Mas há uma sutileza 🧬 aí relacionada à quantidade de eventos possíveis. Em baralho é jogo de azar
nossas tabelas, por exemplo, usamos percentuais de probabilidades com duas casas
🧬 decimais. Isso significa que só distinguimos as probabilidades de 0,001% em baralho é jogo de azar
0,001%. Com isso, se obtivermos que as chances 🧬 de um time ser campeão são menores que
0,0005% (por exemplo, uma em baralho é jogo de azar um milhão), isso será representado em 🧬 baralho é jogo de azar nossa
tabela como 0,000%. Isso quer dizer que é estatisticamente improvável que esse time
seja campeão, mesmo que ainda 🧬 haja uma possibilidade matemática disto acontecer (para
mais detalhes, clique aqui). É claro que quando o time não tiver mais 🧬 possibilidade de
ser campeão (se faltando cinco rodadas ele estiver 20 pontos atrás do líder, por
exemplo) nossa tabela também 🧬 mostrará 0,000% de probabilidade para este time ser
campeão.