“The Game” es un juego de cartas en el que los jugadores juegan todos juego para ganar al propio juego. En este juego cada jugador (agente) dispone de un conjunto de cartas que se toman aleatorias y que el solo conoce. El grupo ganará si todos los jugadores consiguen desprenderse de todas las cartas que deben ir colocando en varios mazos.
Se propone entrenar a un grupo de agentes mediante entrenamiento por refuerzo para encontrar la mejor estrategia
que haga ganar al “juego”. Dado que los jugadores no conocen que otras cartas tiene el resto de los jugadores y están obligados a soltar cartas en cada turno la estrategia a seguir no es trivial.
Entre los agentes se permite cierto nivel de comunicación. Por ejemplo, se puede indicar que se está interesado en un determinado mazo bajo la creencia que necesita tirar una carta en su poder por el bien del grupo.
Para este trabajo se requerirá o será necesario adquirir los siguientes conocimientos:
- Conocimientos de aprendiza automático.
- Deep Learning (curso impartido en el máster MULCIA).
- Tensorflow (Keras) o Pytorch.
El fin último de este trabajo será la publicación de los resultados.
Referencias:
- Brown, Noam, et al. "Combining deep reinforcement learning and search for imperfect-information games." Advances in Neural Information Processing Systems 33 (2020): 17057-17069.
- Lei, Chen. "Deep reinforcement learning." Deep Learning and Practice with MindSpore. Springer, Singapore, 2021. 217-243.
-
Cuayáhuitl, Heriberto, Simon Keizer, and Oliver Lemon. "Strategic dialogue management via deep reinforcement learning." arXiv preprint arXiv:1511.08099 (2015).