Is vanilla policy gradient overlooked? analyzing deep reinforcement learning for hanabi

B Grooten, J Wemmenhove, M Poot… - arXiv preprint arXiv …, 2022 - arxiv.org
In pursuit of enhanced multi-agent collaboration, we analyze several on-policy deep
reinforcement learning algorithms in the recently published Hanabi benchmark. Our …

Umělá inteligence pro hru Hanabi

L Ambrožová - 2023 - dspace.cuni.cz
Hra Hanabi je v současnosti velice populární pro vývoj nejrůznějších umělých inteli-gencí.
Tato popularita spočívá především v tom, že Hanabi je stochastické, možné hrát ve více …