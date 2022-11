Des chercheurs de Meta ont développé une nouvelle intelligence artificielle qui s’appelle CICERO. Selon eux, c’est « la première IA à atteindre des performances de niveau humain dans le jeu de stratégie populaire Diplomacy ». Ce n’est cependant pas la première IA à jouer à des jeux. On n’oublie pas l’IA Libratus qui a gagné un tournoi de poker contre les humains en 2017. Plus récemment, en 2019, l’IA de Google a envoyé à la retraite un champion sud-coréen de Go.

Démonstration de CICERO qui joue à Diplomacy © Meta

La caractéristique principale qui différencie CICERO des autres intelligences artificielles est sa capacité d’interagir et de négocier avec des humains. En effet, Diplomacy est un jeu de stratégie avant tout basé sur les négociations entre les joueurs qui forgent ou brisent des alliances. Pour gagner, il ne suffit pas de bien savoir placer ses pions. Le plus important est de communiquer avec les autres joueurs.

CICERO a « plus du double du score moyen » des joueurs de Diplomacy

Des chercheurs de Meta ont expliqué que CICERO a peaufiné ses compétences en jouant à une version en ligne de Diplomacy. Progressivement, l’IA a tellement progressé qu’elle a atteint le niveau de maître dans le jeu. Actuellement, CICERO se classe parmi les 10 % des meilleurs joueurs qui ont fini plus d’un match de Diplomacy.

Selon Meta qui a licencié des milliers d’employés, CICERO est capable d’atteindre « plus du double du score moyen » des joueurs humains. Pour parvenir à un tel résultat, les chercheurs de Meta se sont servis de modèles d’IA pour le raisonnement stratégique comme AlphaGO, l’IA de Google. Ils ont aussi utilisé des modèles de langage comme GPT-3 développé par OpenAI. Les différents modèles ont été regroupés dans une seule intelligence artificielle, CICERO.

Pendant une partie de Diplomacy, CICERO commence par examiner le plateau de jeu et prédit comment les joueurs vont agir. Ensuite, l’IA élabore un plan pour gagner la partie. Elle est alors capable de générer un dialogue de type humain qui lui permet de communiquer avec d’autres joueurs. « CICERO peut en déduire, par exemple, que plus tard dans le jeu, elle aura besoin du soutien d’un joueur en particulier, puis élaborer une stratégie pour gagner la faveur de cette personne – et même reconnaître les risques et les opportunités que ce joueur voit de son point de vue particulier », a expliqué Meta.

Source : Ars Technica