Sobre o Algoritmo O primeiro programa de computador a superar os profissionais humanos
o heads-up no-limit Hold'em poker Em 4bet poker um 💰 estudo concluído dezembro 2024 e
44.000 mãos de poker, DeepStack derrotou 11 jogadores profissionais de pôquer com
s um fora da 💰 margem de significância estatística. Em 4bet poker todos os jogos jogados, o
Stack ganhou 49 big blinds/100 (sempre dobrando só perderia 75 💰 bb/100), mais de quatro
esvios padrão
heads-up no-limit Texas Hold'em poker. Jogos são negócios sérios Não
o nome enganar você, "jogos" de 💰 informações imperfeitas fornecem um modelo matemático
eral que descreve como os tomadores de decisão interagem. A pesquisa de IA tem uma
💰 história de uso de jogos de salão para estudar esses modelos, mas a atenção tem sido
cada principalmente em 4bet poker jogos 💰 perfeitos de informação, como damas, xadrez ou ir. O
oker é o jogo por excelência de informaç
Até agora, abordagens de IA 💰 competitivas em
} jogos de informação imperfeitos normalmente raciocinaram sobre todo o jogo,
uma estratégia completa antes do jogo. No entanto, 💰 para tornar essa abordagem viável
4bet poker heads-up no-limit Texas hold’em um jogo com situações muito mais únicas do que
stem átomos 💰 no universo uma abstração simplificada do game é frequentemente necessária.
Uma abordagem fundamentalmente diferente DeepStack é a primeira aplicação teoricamente
ólida da 💰 pesquisa heurística.
No coração do DeepStack está a resolução contínua, uma
ida computação de estratégia local que só considera situações como elas 💰 surgem durante
jogo. Isso permite que o DeepStack evite computar uma estratégia completa com
cia, contornando a necessidade de abstração explícita. 💰 Durante a re-solução, o
não precisa raciocinar sobre todo o restante do jogo porque substitui uma
rofundidade certa com uma estimativa 💰 aproximada rápida, "intuição" DeepStack de Deep
ck - uma sensação de coragem do valor de manter quaisquer cartões privados possíveis em
4bet poker 💰 qualquer situação de poker possível. Finalmente, intuição Deepstack, muito
com intuição humana, precisa ser treinado. Nós treiná-lo com aprendizagem profunda
do 💰 exemplos gerados a partir de situações de pôquer aleatório. DeepStack é teoricamente
som, produz estratégias substancialmente mais difíceis de explorar do 💰 que técnicas
das em
heads-up poker sem limite com