Sobre o Algoritmo O primeiro programa de computador a superar os profissionais humanos
o heads-up no-limit Hold'em poker Em poker online grátis brincar um 📉 estudo concluído dezembro 2024 e
44.000 mãos de poker, DeepStack derrotou 11 jogadores profissionais de pôquer com
s um fora da 📉 margem de significância estatística. Em poker online grátis brincar todos os jogos jogados, o
Stack ganhou 49 big blinds/100 (sempre dobrando só perderia 75 📉 bb/100), mais de quatro
esvios padrão
heads-up no-limit Texas Hold'em poker. Jogos são negócios sérios Não
o nome enganar você, "jogos" de 📉 informações imperfeitas fornecem um modelo matemático
eral que descreve como os tomadores de decisão interagem. A pesquisa de IA tem uma
📉 história de uso de jogos de salão para estudar esses modelos, mas a atenção tem sido
cada principalmente em poker online grátis brincar jogos 📉 perfeitos de informação, como damas, xadrez ou ir. O
oker é o jogo por excelência de informaç
Até agora, abordagens de IA 📉 competitivas em
} jogos de informação imperfeitos normalmente raciocinaram sobre todo o jogo,
uma estratégia completa antes do jogo. No entanto, 📉 para tornar essa abordagem viável
poker online grátis brincar heads-up no-limit Texas hold’em um jogo com situações muito mais únicas do que
stem átomos 📉 no universo uma abstração simplificada do game é frequentemente necessária.
Uma abordagem fundamentalmente diferente DeepStack é a primeira aplicação teoricamente
ólida da 📉 pesquisa heurística.
No coração do DeepStack está a resolução contínua, uma
ida computação de estratégia local que só considera situações como elas 📉 surgem durante
jogo. Isso permite que o DeepStack evite computar uma estratégia completa com
cia, contornando a necessidade de abstração explícita. 📉 Durante a re-solução, o
não precisa raciocinar sobre todo o restante do jogo porque substitui uma
rofundidade certa com uma estimativa 📉 aproximada rápida, "intuição" DeepStack de Deep
ck - uma sensação de coragem do valor de manter quaisquer cartões privados possíveis em
poker online grátis brincar 📉 qualquer situação de poker possível. Finalmente, intuição Deepstack, muito
com intuição humana, precisa ser treinado. Nós treiná-lo com aprendizagem profunda
do 📉 exemplos gerados a partir de situações de pôquer aleatório. DeepStack é teoricamente
som, produz estratégias substancialmente mais difíceis de explorar do 📉 que técnicas
das em
heads-up poker sem limite com