Sobre o Algoritmo O primeiro programa de computador a superar os profissionais humanos
o heads-up no-limit Hold'em poker Em poker stud um 8️⃣ estudo concluído dezembro 2024 e
44.000 mãos de poker, DeepStack derrotou 11 jogadores profissionais de pôquer com
s um fora da 8️⃣ margem de significância estatística. Em poker stud todos os jogos jogados, o
Stack ganhou 49 big blinds/100 (sempre dobrando só perderia 75 8️⃣ bb/100), mais de quatro
esvios padrão
heads-up no-limit Texas Hold'em poker. Jogos são negócios sérios Não
o nome enganar você, "jogos" de 8️⃣ informações imperfeitas fornecem um modelo matemático
eral que descreve como os tomadores de decisão interagem. A pesquisa de IA tem uma
8️⃣ história de uso de jogos de salão para estudar esses modelos, mas a atenção tem sido
cada principalmente em poker stud jogos 8️⃣ perfeitos de informação, como damas, xadrez ou ir. O
oker é o jogo por excelência de informaç
Até agora, abordagens de IA 8️⃣ competitivas em
} jogos de informação imperfeitos normalmente raciocinaram sobre todo o jogo,
uma estratégia completa antes do jogo. No entanto, 8️⃣ para tornar essa abordagem viável
poker stud heads-up no-limit Texas hold’em um jogo com situações muito mais únicas do que
stem átomos 8️⃣ no universo uma abstração simplificada do game é frequentemente necessária.
Uma abordagem fundamentalmente diferente DeepStack é a primeira aplicação teoricamente
ólida da 8️⃣ pesquisa heurística.
No coração do DeepStack está a resolução contínua, uma
ida computação de estratégia local que só considera situações como elas 8️⃣ surgem durante
jogo. Isso permite que o DeepStack evite computar uma estratégia completa com
cia, contornando a necessidade de abstração explícita. 8️⃣ Durante a re-solução, o
não precisa raciocinar sobre todo o restante do jogo porque substitui uma
rofundidade certa com uma estimativa 8️⃣ aproximada rápida, "intuição" DeepStack de Deep
ck - uma sensação de coragem do valor de manter quaisquer cartões privados possíveis em
poker stud 8️⃣ qualquer situação de poker possível. Finalmente, intuição Deepstack, muito
com intuição humana, precisa ser treinado. Nós treiná-lo com aprendizagem profunda
do 8️⃣ exemplos gerados a partir de situações de pôquer aleatório. DeepStack é teoricamente
som, produz estratégias substancialmente mais difíceis de explorar do 8️⃣ que técnicas
das em
heads-up poker sem limite com