Como probabilidades podem ser usadas em jogador do palmeiras um campeonato de futebol?
O que nós
utilizamos em jogador do palmeiras nosso programa?
Como podemos definir 🍊 a probabilidade de cada
evento?
Qual a diferença entre uma afirmação matematicamente verdadeira e uma
estatisticamente provável?
Será que 100% de chances 🍊 significa certeza do evento
ocorrer?
Como probabilidades podem ser usadas em jogador do palmeiras um campeonato de futebol?
O
campeonato brasileiro, com jogador do palmeiras atual 🍊 fórmula de dois turnos disputados por 20 equipes,
torna-se um excelente problema para se discutir probabilidades. Vale lembrar que são
🍊 dois turnos, cada um com 19 rodadas de 10 jogos. Assim, o campeonato completo tem 380
jogos. Se não nos 🍊 preocuparmos com saldo de gols, mas apenas em jogador do palmeiras separar os
resultados em jogador do palmeiras vitória, empate ou derrota, teremos 380 🍊 “sorteios” com três
alternativas cada. Isso dá um total de 3380 “campeonatos” diferentes.
A maioria das
pessoas têm dificuldade em jogador do palmeiras 🍊 imaginar este número. Por exemplo, normalmente as
pessoas consideram “muito grande” o número de grãos de areia em jogador do palmeiras uma 🍊 praia. O
número de combinações de resultado possíveis no campeonato brasileiro é bem maior que
isso. Para se ter idéia, 🍊 o número de resultados possíveis em jogador do palmeiras apenas uma rodada é
310 = 59.049, ou seja, se pedirmos para cada 🍊 pessoa guardar uma combinação possível,
precisaremos de toda o público de um clássico para dar conta de uma rodada.
Nesse mesmo
🍊 sistema (uma pessoa por combinação possível), usaremos toda a audiência de um final de
Copa do Mundo (metade da população 🍊 da Terra) para guardar todas as combinações
possíveis de duas rodadas: 320 combinações possíveis. Tentemos uma abordagem diferente.
Por exemplo, 🍊 cada átomo do seu corpo poderia guardar uma das combinações de resultados
(não pergunte como). Seu corpo tem da ordem 🍊 de 1026 átomos, que com um pouco mais de
boa vontade pode ser o suficiente para guardar os resultados de 🍊 cinco rodadas! E já que
começamos a usar os átomos para guardar os resultados possíveis, que tal usarmos todos
os 🍊 átomos do sistema solar? Podemos estimar que estes seriam suficientes para 12
rodadas do campeonato. Só por curiosidade, o número 🍊 3380 de combinações possíveis de
resultados é maior que 10180, ou seja, o número formado pelo algarismo 1 seguido por
🍊 180 zeros!
Se por um lado essa quantidade de resultados torna impossível considerá-las
individualmente, causa conforto saber que a relação entre 🍊 probabilidades e “o mundo
real” depende de um resultado matemático conhecido como Lei dos Grandes Números. A
grosso modo, não 🍊 adianta muito você saber que um dado de seis faces é honesto se ele
for lançado uma única vez. Ou 🍊 ainda, você não terá como saber se ele é ou não honesto
apenas com esse lançamento. Já se esse dado 🍊 for lançado um milhão de vezes, você sabe
de antemão que, se ele for honesto, a chance é imensa que 🍊 a quantidade de vezes que a
face quatro vai aparecer estará entre 160 mil e 170 mil. Se, por outro 🍊 lado, isso não
acontecer, é muito grande a chance que o dado não seja honesto.
Todos que gostam de
futebol devem 🍊 concordar que há uma diferença conceitual entre a loteria esportiva e
outras loterias numéricas (ou jogos com dados). Nas loterias 🍊 numéricas acreditamos que
todos os números envolvidos no sorteio são equiprováveis (têm a mesma chance de ser
sorteado). Já na 🍊 loteria esportiva, os jogos comumente têm favoritos e “zebras”, ou
seja, há uma distribuição desigual da probabilidade entre os possíveis 🍊 resultados. É
com este tipo de problema que nos deparamos ao tentar tratar o Campeonato Brasileiro de
Futebol probabilisticamente.
Nosso problema 🍊 é ainda um pouco mais complicado do que o
que já foi exposto. As probabilidades de cada resultado em jogador do palmeiras 🍊 cada jogo dependem de
muitos fatores, impossíveis de se levar em jogador do palmeiras conta nos mínimos detalhes. Como
exemplos, temos o 🍊 estádio onde é disputada a partida, a temperatura no horário do jogo,
se chove ou não, os desfalques de cada 🍊 equipe, os resultados recentes dos times, a
situação de cada um no campeonato, o árbitro escalado para o confronto…
Finalizando,
temos 🍊 um número muito grande de possibilidades, cada uma delas tem uma probabilidade de
ocorrer. Para saber a chance de um 🍊 time ser campeão, devemos somar as probabilidades de
cada alternativa que dá o título a este time. Parece simples, mas 🍊 levando em jogador do palmeiras
consideração o número de alternativas discutido acima, esta estratégia se torna
inviável, exceto se fizermos muitas simplificações.
O 🍊 que nós utilizamos em jogador do palmeiras nosso
programa?
Inúmeros fatores influenciam nas probabilidades de resultado de um jogo de
futebol. Assim, qualquer 🍊 modelo criado para simular o campeonato é necessariamente
super simplificado. E este é um dos aspectos mais fascinantes do problema 🍊 geral de
modelagem: como conseguir bem descrever uma situação complexa com modelos simples?
A
primeira grande simplificação que fazemos é que, 🍊 ao invés de nos preocuparmos em jogador do palmeiras
determinar todas as combinações possíveis de resultados, atribuimos probabilidades a
elas, para depois 🍊 somar as probabilidades dos casos favoráveis, fazemos um grande
número de simulações do campeonato. Feitas as simulações, contamos quantas terminaram
🍊 com o resultado favorável (tal time campeão ou tal time rebaixado…) e dividimos pelo
número total de simulações.
Duas perguntas são 🍊 naturais aí: onde entram as
probabilidades de cada jogo e até que ponto as probabilidades estimadas dessa maneira
são confiáveis?
As 🍊 probabilidades de cada jogo entram na ideia de simulação. A
simulação usa o sorteio de um número aleatório para definir 🍊 o vencedor de cada partida.
Este número aleatório é sorteado como um número positivo menor que, ou igual a, 1. 🍊 Se,
por algum motivo, consideramos que o mandante de um certo jogo (isso varia de jogo para
jogo, detalhes mais 🍊 abaixo) tem 45% de chance de vitória, 35% de chance de empate e 20%
de chance de derrota, vamos considerá-lo 🍊 vitorioso, nesta simulação, se o número
aleatório for menor que (ou igual a) 0,45, consideraremos o resultado como empate se 🍊 o
número estiver acima de 0,45 e abaixo de (ou igual a) 0,80 e consideraremos o resultado
de vitória do 🍊 visitante se aquele número aleatório estiver acima de 0,80. Sendo mais
geral, para cada partida, temos um número p<1 que 🍊 dá a probabilidade da vitória do
mandante, outro número q<1-p que dá a probabilidade do empate. Sorteamos um número
aleatório 🍊 x entre 0 e 1, se x≤p o mandante venceu este jogo nesta simulação; se p
p+q, o é considerado 🍊 empate; se x>p+q, o visitante é que venceu. Entendido como
simulamos o resultado de uma partida, basta dizermos que uma 🍊 rodada do Campeonato é
simulada fazendo as 10 partidas desta forma.
O problema agora é saber como determinar
os números p 🍊 e q que definem as probabilidades para cada jogo. Aqui entra a arte da
modelagem, citada acima. Se o Brasil 🍊 fosse o “país da matemática”, ao invés do “país do
futebol”, possivelmente diríamos que cada brasileiro é um modelador, assim 🍊 como dizemos
que cada brasileiro é um técnico de futebol. Existem infinitas maneiras de gerar estes
números p e q 🍊 e não é fácil decidir “qual a melhor maneira” (sequer é fácil decidir o
que significa “melhor”). Escolhemos uma, que 🍊 nos pareceu razoável. Com o passar do
tempo, fizemos algumas modificações. Queremos compará-la com várias outras
possibilidades, o que deve 🍊 ser feito no futuro. Algumas características de nossa
modelagem:
As probabilidades dependerão apenas da história das equipes dentro do
próprio campeonato; 🍊 O mando de campo é um fator importante, mas times diferentes reagem
de maneiras diferentes a este fator; Vencer uma 🍊 partida aumenta a probabilidade de
vencer outras; Perder aumenta a probabilidade de perder; Empatar aumenta a
probabilidade de empatar.
A primeira 🍊 é apenas um fator simplificador e destinado a
evitar “preconceitos” nossos, como tentar definir quanto “pesa a camisa” de cada 🍊 time
ou outros conceitos. De fato, isto não é verdade. A história anterior de cada clube, os
fatos recentes, os 🍊 desfalques, se ele disputa outras competições simultaneamente… tudo
isso “entra em jogador do palmeiras campo”, mas se torna difícil de modelar. E 🍊 sempre é bom começarmos
por modelos simples. A segunda parece uma hipótese razoável, e encontramos uma maneira
simples de incluí-la 🍊 em jogador do palmeiras nosso modelo. Já a terceira é apenas uma espécie de versão
futebolística de “o rio corre para o 🍊 mar”: times que vencem muito tornam-se
favoritos.
Vamos ao modelo. A cada rodada, cada time é descrito por dois trios de
🍊 números. Um trio representa seu perfil de mandante e o outro trio seu perfil de
visitante. Isoladamente, o trio de 🍊 números que descreve o perfil de mandante de um time
pode ser pensado como a jogador do palmeiras tendência a vencer, empatar 🍊 ou perder jogos em jogador do palmeiras casa.
Da mesma forma para seu perfil de visitante. Cada um desses números é positivo 🍊 e a soma
de cada trio é sempre 1. Quando o time A recebe o time B para jogar “em 🍊 jogador do palmeiras casa”, o
número p que representa a probabilidade de vitória do mandante será inferido fazendo a
média aritmética entre 🍊 a tendência de vitória expressa pelo perfil de mandante de A e a
tendência de derrota do perfil de visitante 🍊 de B. De maneira análoga, obtém-se q
fazendo a média das tendências de empate. Pela propriedade de soma 1, estes 🍊 dois número
descrevem as probabilidades das três alternativas consideradas.
Uma característica
importante do nosso modelo é que, terminada a rodada, os 🍊 perfis dos times são
atualizados, de acordo com a hipótese 3 acima. O que fazemos é alterar o perfil de
🍊 mandante daqueles que jogaram como mandantes na rodada e o perfil de visitante dos
demais. Para isso, fazemos uma média 🍊 ponderada entre o perfil antes da rodada e o trio
de números que descreve o resultado (um para o resultado 🍊 ocorrido, zero para as outras
duas alternativas). Surge aí uma questão: quais pesos usar nesta média ponderada? É
natural que 🍊 o perfil anterior tenha um peso maior do que o resultado apenas do último
jogo. O quanto maior é uma 🍊 questão que não sabemos responder. Já usamos alguns valores
diferentes em jogador do palmeiras nosso programa, e recentemente resolvemos incluir ainda o 🍊 desempenho
do adversário nesta conta. Vencer um adversário bom muda mais o perfil de um time do
que vencer um 🍊 adversário fraco. Da mesma forma, perder para um adversário fraco piora
mais o perfil do que perder para o líder 🍊 do campeonato.
Assim, começando com os dados
das rodadas já realizadas, obtemos os perfis de cada equipe e rodamos as simulações.
🍊 Atualmente, rodamos da ordem de um milhão de “campeonatos”, para determinar as
probabilidades exibidas nesta página. Como hipótese não tendenciosa 🍊 usamos inicialmente
o mesmo perfil para todos os times: 4-3-3, que aqui não é esquema tático, mas apenas
uma probabilidade 🍊 um pouco maior de vitória do mandante do que dos outros dois
resultados (estes números também foram escolhidos apenas por 🍊 simplicidade, e de fato
significam o trio [0.4, 0.3, 0.3]).
Como podemos definir a probabilidade de cada
evento?
Para essa pergunta, não 🍊 há uma resposta precisa. Há sempre uma grande
dependência em jogador do palmeiras hipóteses que assumimos. Por exemplo, ao considerarmos que um 🍊 cara
ou coroa apresenta 50% de probabilidade para cada resultado, assumimos, por exemplo,
que a moeda nunca “pára de pé”. 🍊 Também assumimos que o lançamento e a própria
distribuição de material na moeda não “viciam” tal lançamento.
Qual a diferença entre
🍊 uma afirmação matematicamente verdadeira e uma estatisticamente provável?
A Matemática
tem um forte compromisso com a Lógica. Mantendo em jogador do palmeiras mente 🍊 nosso exemplo de um
campeonato de futebol por pontos corridos, um time só pode ser dito matematicamente
livre do rebaixamento, 🍊 ou matematicamente classificado para a Libertadores, ou qualquer
outra expressão deste tipo, quando todas as combinações ainda possíveis àquela altura
🍊 do campeonato levam a esta mesma conclusão (o rebaixamento de tal time, ou a
classificação para a Libertadores de tal 🍊 outro).
Se quisermos ser ainda mais precisos
(e os matemáticos têm este hábito), devemos deixar claras algumas hipóteses assumidas
para que 🍊 seja verdade um fato do tipo “tal time está matematicamente rebaixado”. Por
exemplo, assumimos que nenhum time será punido por 🍊 alguma atitude irregular (utilização
ilegal de jogador, compra de árbitros…) com perda de pontos.
Mas como a cada rodada
ainda são 🍊 sempre muitas as possibilidades do campeonato, pode acontecer de um evento
ser extremamente provável (por exemplo, ter 99,9% de chances). 🍊 Tais eventos são ditos
estatisticamente prováveis. Quando o rebaixamento de um certo time é estatisticamente
provável, isso significa que muito 🍊 provavelmente ele vai cair sim, mas que “ainda há
esperanças”. Em jogador do palmeiras geral, é o que fica conhecido como “só 🍊 uma improvável combinação
de resultados para salvar tal equipe”.
Um dos nossos objetivos ao criar esta página é
separar muito claramente 🍊 o que são fatos matemáticos e o que são possibilidades
estatísticas.
Será que 100% de chances significa certeza do evento ocorrer?
A 🍊 primeira
vista, um evento 100% provável acontece sempre e um evento com probabilidade zero nunca
acontece. Mas há uma sutileza 🍊 aí relacionada à quantidade de eventos possíveis. Em jogador do palmeiras
nossas tabelas, por exemplo, usamos percentuais de probabilidades com duas casas
🍊 decimais. Isso significa que só distinguimos as probabilidades de 0,001% em jogador do palmeiras
0,001%. Com isso, se obtivermos que as chances 🍊 de um time ser campeão são menores que
0,0005% (por exemplo, uma em jogador do palmeiras um milhão), isso será representado em 🍊 jogador do palmeiras nossa
tabela como 0,000%. Isso quer dizer que é estatisticamente improvável que esse time
seja campeão, mesmo que ainda 🍊 haja uma possibilidade matemática disto acontecer (para
mais detalhes, clique aqui). É claro que quando o time não tiver mais 🍊 possibilidade de
ser campeão (se faltando cinco rodadas ele estiver 20 pontos atrás do líder, por
exemplo) nossa tabela também 🍊 mostrará 0,000% de probabilidade para este time ser
campeão.