Sobre o Algoritmo O primeiro programa de computador a superar os profissionais humanos
o heads-up no-limit Hold'em poker Em poker hi lo um 🫦 estudo concluído dezembro 2024 e
44.000 mãos de poker, DeepStack derrotou 11 jogadores profissionais de pôquer com
s um fora da 🫦 margem de significância estatística. Em poker hi lo todos os jogos jogados, o
Stack ganhou 49 big blinds/100 (sempre dobrando só perderia 75 🫦 bb/100), mais de quatro
esvios padrão
heads-up no-limit Texas Hold'em poker. Jogos são negócios sérios Não
o nome enganar você, "jogos" de 🫦 informações imperfeitas fornecem um modelo matemático
eral que descreve como os tomadores de decisão interagem. A pesquisa de IA tem uma
🫦 história de uso de jogos de salão para estudar esses modelos, mas a atenção tem sido
cada principalmente em poker hi lo jogos 🫦 perfeitos de informação, como damas, xadrez ou ir. O
oker é o jogo por excelência de informaç
Até agora, abordagens de IA 🫦 competitivas em
} jogos de informação imperfeitos normalmente raciocinaram sobre todo o jogo,
uma estratégia completa antes do jogo. No entanto, 🫦 para tornar essa abordagem viável
poker hi lo heads-up no-limit Texas hold’em um jogo com situações muito mais únicas do que
stem átomos 🫦 no universo uma abstração simplificada do game é frequentemente necessária.
Uma abordagem fundamentalmente diferente DeepStack é a primeira aplicação teoricamente
ólida da 🫦 pesquisa heurística.
No coração do DeepStack está a resolução contínua, uma
ida computação de estratégia local que só considera situações como elas 🫦 surgem durante
jogo. Isso permite que o DeepStack evite computar uma estratégia completa com
cia, contornando a necessidade de abstração explícita. 🫦 Durante a re-solução, o
não precisa raciocinar sobre todo o restante do jogo porque substitui uma
rofundidade certa com uma estimativa 🫦 aproximada rápida, "intuição" DeepStack de Deep
ck - uma sensação de coragem do valor de manter quaisquer cartões privados possíveis em
poker hi lo 🫦 qualquer situação de poker possível. Finalmente, intuição Deepstack, muito
com intuição humana, precisa ser treinado. Nós treiná-lo com aprendizagem profunda
do 🫦 exemplos gerados a partir de situações de pôquer aleatório. DeepStack é teoricamente
som, produz estratégias substancialmente mais difíceis de explorar do 🫦 que técnicas
das em
heads-up poker sem limite com