DeepCube : l'IA qui résout des rubiks cube sans aide humaine



DeepCube réussira à "résoudre 100% des cubes brouillées au hasard en 30 coups", une performance identique à celle des experts actuels. Les chercheurs ont utilisé une autre approche pour concevoir leur algorithme.

D’après les précisions fournies par Paul Lilly dans HotHardware le processus habituel est basé un système de récompenses. Les machines déterminent si un coup était bon ou mauvais en analysant les règles du jeu. De leur côté, Forest Agostinelli et son équipe ont tranché en faveur de l'itération autodidactique. Le programme apprend une stratégie et décide "quel mouvement réaliser dans une configuration donnée."

DeepCube utilise une approche inversée

La Revue du MIT détaille le mode de fonctionnement. Quand on lui donne un cube à résoudre, la machine détermine si un coup améliore la situation ou non. Pour cela, "elle doit être capable de l’évaluer." L’itération autodidactique y parvient en commençant par le cube fini et en "travaillant vers l’arrière" afin de trouver le meilleur déplacement.

Les scientifiques visent aussi d’autres objectifs. La prise de décision séquentielle permettrait de trouver des solutions "à d'autres problèmes d'optimisation combinatoire tels que la prédiction de la structure tertiaire des protéines". Pour information, les chercheurs ont utilisé un serveur Intel Xeon E5-2620 de 32 cœurs dotés de trois cartes NVIDIA Titan XP.

>>> Rubik’s Cube : 4.22 secondes, record battu

Posez une question dans la catégorie News du forum
Cette page n'accepte plus de commentaires
Soyez le premier à commenter
Commenter depuis le forum
    Votre commentaire