En poursuivant votre navigation, vous acceptez l'utilisation de cookies destinés à des fins de mesure d'audience, à améliorer la performance de ce site et à vous proposer des services et contenus personnalisés. En savoir plus

X

Colloque « Science et Jeu vidéo » : IA et coopération

Hanabi, jeu de société où les joueurs doivent coopérer pour partager une information incomplète, est considéré comme le nouveau défi pour les intelligences artificielles. C’est sur ce jeu de société qu’ont porté les regards croisés d’Antoine Bauza, Vicky Kalogeiton, Pierre Beri lors du colloque de la Chaire « Science & jeu vidéo ».

Depuis les travaux des chercheurs de Google DeepMind en 2019, Hanabi est décrit comme « la nouvelle frontière de la recherche en intelligence artificielle ». Les regards croisés d’Antoine Bauza, auteur de jeux de société dont Hanabi en 2010, Vicky Kalogeiton, chercheuse au Laboratoire d'informatique de l'École polytechnique (LIX*) dans l’équipe GeoViC, et Pierre Beri, joueur émérite avec près de 7000 parties de Hanabi à son actif, nous en apprennent plus sur le jeu et ses subtilités, tant pour les humains que pour les IA. Ces échanges, accompagnés par David Louapre, directeur scientifique d’Ubisoft, ont eu lieu dans le cadre du deuxième colloque annuel de la Chaire « Science et Jeu vidéo », soutenue par Ubisoft et hébergée au Laboratoire Leprince-Ringuet (LLR*).

Hanabi est un jeu de société coopératif à information incomplète, car chaque joueur voit uniquement les cartes des autres. La coordination se fait par le biais d’indices en nombre restreint, limitant ainsi la connaissance de ses propres cartes. Plusieurs interprétations sont possibles pour ces indices, requérant finesse et compréhension du jeu et des intentions des autres joueurs pour une bonne transmission de l’information. Ce jeu repose sur la « théorie de l’esprit », où un joueur présume que les autres pensent comme lui et vont s’adapter à sa façon de jouer.

Recevant la prestigieuse récompense « Spiel des Jahres » en 2013, Hanabi pose de multiples défis pour les chercheurs en IA. En effet, le jeu d’Antoine Bauza nécessite d’anticiper le comportement des autres joueurs pour se coordonner avec eux. Vicky Kalogeiton, experte de l’intelligence artificielle pour la compréhension vidéo, explique que cette manière de jouer est en contradiction avec la technique d’apprentissage la plus répandue pour les IA.

Cette dernière, le « renforcement par apprentissage », consiste à intégrer les règles d’un jeu dans la conception d’une IA et à la faire jouer contre elle-même un grand nombre de parties. La technique a fait ses preuves, notamment en 1997 lors de la victoire historique de Deeperblue, superordinateur qui a remporté la victoire face au champion du monde d'échec Garry Kasparov. Plus récemment, la technique a permis à « AlphaStar », algorithme multi-agent de renforcement par apprentissage, de se hisser au niveau des meilleurs joueurs de Starcraft 2. Ce jeu vidéo est pourtant reconnu comme l’un des e-sports professionnels les plus difficiles, ainsi que pour sa pertinence par rapport au monde réel en termes de complexité brute.

Depuis les travaux des chercheurs de Google DeepMind, plus de 250 articles de recherche sont parus sur Hanabi, qui reste un défi pour les intelligences artificielles. La coordination avec d’autres joueurs humains et l’adaptation à leurs actions renverse le paradigme du renforcement par apprentissage et inspire les chercheurs en IA pour repousser les frontières des algorithmes.

> Lire aussi :

Retour sur le colloque de la Chaire « Sciences et Jeu vidéo »

Colloque « Sciences et Jeu vidéo » : Le réalisme de la physique

Colloque « Sciences et Jeu vidéo » : La diversité des intelligences

*LIX : une unité mixte de recherche CNRS, École polytechnique - Institut Polytechnique de Paris
LLR : une unité mixte de recherche CNRS, École polytechnique - Institut Polytechnique de Paris

> à propos de la Chaire
Organisée en Gamelab et soutenue par Ubisoft, la Chaire « Science et Jeu vidéo » s’attache à renforcer le réalisme, le gameplay et l’accessibilité des jeux vidéo grâce à la science, ainsi qu’à utiliser ce média pour diffuser la culture scientifique. Portée depuis 2019 par Raphaël Granier de Cassagnac, cette Chaire, par nature interdisciplinaire, vise à faciliter l’intégration vidéoludique de modèles (physiques, économiques, sociaux…) et aborde des techniques variées comme la modélisation 3D, la spatialisation sonore ou l’intelligence artificielle. L’enseignement est un autre axe innovant de la Chaire, visant à familiariser les élèves ingénieurs avec les méthodologies de l’industrie et à former un vivier de professionnels du jeu vidéo.