Une nouvelle technique de recherche d'image

MIT imageIl existe des tâches pour lesquelles, du moins pour l’instant, le cerveau humain sera toujours plus performant que le plus puissant ordinateur. Des tâches qui, si elles nous semblent bien faciles, donnent du fil à retordre à nos machines. L’une d’elle, est la recherche d’une image. Cependant, une astuce a été trouvée pour résoudre en partie le problème.

Décoder les traits caractéristiques d’une image

Le problème de l’ordinateur est que pour trouver une image celui-ci utilise son titre ou bien des mots clés. C’est là, la base du problème. Par exemple, vous nommez la photo de votre chat « Castor », la photo aura beau représenter votre chat, si vous ne demandez pas à la machine de trouver les images correspondantes à « castor » vous n’êtes pas prêt de revoir votre photo si elle est perdue.

Cependant, Antonio Torralba (Massachussetts Institute of Technology), Rob Fergus (Courant Institute of Mathematical Sciences, université de New York) et Yair Weiss (School of Computer Science, Hebrew University, Jérusalem, Israël) ont découvert que l’on pouvait toujours reconnaitre une image si elle était compressée énormément. Ainsi, des images et photo compressées de 256 et 1024 octets restent reconnaissables pour l’œil humain.

MIT images tailleMIT image mosaique

Et concrètement ?

Leur idée est de simplifier les images au maximum pour faire des copies de petite taille (en octets), et de mettre au point une méthode mathématique pour caractériser les formes présentes sur l’image. « Nous essayons de trouver un code binaire très court pour identifier une image » précise Antonio Torralba.

Pour l’instant, leur méthode ne fonctionne que par comparaison, ce qui reste déjà une très grande avancée. À partir d’image ou d’une photo, on peut trouver toutes celles qui lui ressemblent dans une photothèque. De plus, grâce à la taille très réduite des images (entre 256 et 1024 octets), la recherche se fait rapidement, permettant ainsi à un simple ordinateur de bureau de fouiller des bases de données géantes, la première sur la liste étant internet.