Les intelligences artificielles sont aujourd’hui suffisamment sophistiquées pour battre les meilleurs joueurs humains aux échecs, au jeu de Go et même au poker. Mais que se passerait-il si deux intelligences artificielles devaient s’affronter ? C’est la question à laquelle Google DeepMind a voulu répondre en organisant une rencontre entre deux machines et en analysant leur comportement dans différentes situations.

Les deux IA ont été mises dans des situations comparables à un dilemme du prisonnier, c’est à dire une situation où deux personnages peuvent collaborer ou choisir de se trahir l’un-l’autre, mais où les deux personnages perdent s’ils décident tous les deux de trahir. Pour cela, les deux robots ont été mis en situation via deux jeux vidéo créés pour l’occasion, et les ingénieurs de Google ont détaillé leurs recherches dans une note de blog.

Le premier jeu, nommé Gathering, consiste à collecter un maximum de pommes depuis un stock situé au milieu de l’écran. Chaque joueur, bleu ou rouge, dispose d'un laser qu’il peut utiliser à l’encontre de son adversaire pour le paralyser un instant. « Lorsqu’il y a suffisamment de pommes à l’écran, les deux IA se comportent de manière pacifique et collectent autant de pommes que possible », expliquent les ingénieurs sur le blog. « Mais lorsque le nombre de pommes est réduit, les IA apprennent qu’il peut être mieux d’attaquer l’autre joueur pour se donner plus de temps pour récupérer plus de pommes ». Ils notent également que plus les stratégies dictées aux IA sont complexes, plus elles développent un comportement agressif à l’encontre du joueur adverse, et ce quel que soit le nombre de pommes disponibles.



Google DeepMind Gathering



Le deuxième jeu, Wolfpack, réclame quant à lui que deux joueurs coopèrent pour en débusquer un troisième dans un labyrinthe. Cette fois, les IA se comportent différemment en fonction de la complexité des stratégies données par rapport au premier jeu. En effet, des stratégies plus compliquées donnent cette fois lieu à une plus grande coopération de la part des deux IA.



Google DeepMind Wolfpack



Les ingénieurs concluent donc que le comportement d’une IA peut être influencé par les règles qui lui sont imposées. Si les règles récompensent un comportement agressif, alors il sera adopté par une IA, tandis que si elles récompensent la coopération, c’est ce choix qui aura plus tendance à être fait.

Une expérience similaire avait été réalisée, un peu par hasard, par un joueur américain en 2013 sur le jeu Quake 3, dont le but est de vaincre ses adversaires dans un match à mort. Ce dernier avait laissé tourner un serveur sur le jeu et y avait mis plusieurs bots, des programmes destinés à simuler de véritables joueurs contre d’autres bots ou contre un joueur humain. Après avoir laissé tourner son serveur pendant près de 4 ans, il a constaté que les IA contrôlant les bots avaient toutes pris la décision de ne pas se battre, seule manière d’assurer la survie de chacun des joueurs.