ChatGPT manque de données jusqu’en 2026, l’IA ne va plus s’améliorer

Selon les chercheurs, l’intelligence artificielle comme ChatGPT arrive au bout des données disponibles pour s’entraîner. Il faut donc s’attendre à ce que la technologie stagne un long moment, jusqu’en 2026 au moins.

chatgpt ia intelligence artificielle 2026 données
© Envato

Au fil du temps, ChatGPT ne cesse de s’améliorer avec de belles nouveautés. OpenAI a récemment lancé GPT-4 Turbo qui permet notamment la création de chatbots sur-mesure. Si jusqu’à présent, l’intelligence artificielle n’a fait qu’évoluer, il faut désormais s’attendre à une stagnation jusqu’en 2026. C’est en tout cas ce que des chercheurs nous expliquent.

À lire > ChatGPT : qu’est-ce que c’est, comment s’en servir, tout savoir sur la célèbre IA

L’intelligence artificielle est arrivé au bout des données disponibles

L’intelligence artificielle, donc ChatGPT mais aussi d’autres outils comme Bard, ont besoin de données d’entraînement comme carburant. Sauf que selon les chercheurs, ces outils risquent d’en manquer ce qui va modifier leur trajectoire. Pour s’améliorer, les intelligences artificielles ont besoin de ces éléments : 

  • Des données textuelles. Par exemple, ChatGPT repose sur 570 gigaoctets de données textuelles soit environ 300 milliards de mots.
  • Les données LIAON-5B sont un ensemble de 5,8 milliards de paires d’image-texte qui servent à entraîner des intelligences artificielles qui génèrent des images à partir de descriptions textuelles. C’est par exemple le cas de Midjouney et DALL-E, parmi les plus connues.

Sauf que si vous n’avez plus assez de données, l’intelligence artificielle « produira des résultats inexacts ou de mauvaise qualité » préviennent les chercheurs. Et comme vous vous en doutez, elles ont aujourd’hui consommé l’ensemble des données à disposition.

Les données de faible qualité collectées sur les réseaux sociaux ou les photographies floues n’aident pas les intelligences artificielles à être performantes. On trouve beaucoup de désinformation ou de contenus illégaux susceptibles d’être reproduits. Pour rappel, l’intelligence artificielle de Microsoft, Tay, a posté du contenu raciste et misogyne en s’entraînant sur Twitter.

À lire > ChatGPT : comment reconnaître les articles écrits par l’IA ? Cet outil les débusque

Des solutions existent face au manque de données

Autant dire que l’intelligence artificielle se trouve dans une mauvaise passe alors qu’un expert annonce qu’elle risque de conduire à une crise économique majeure. Dans un article publié l’an dernier, les chercheurs annoncent que l’intelligence artificielle sera à court de données textuelles de haute qualité jusqu’en 2026 si cette tendance se poursuit. Les données de faible qualité arriveront à leur fin entre 2030 et 2050 contre entre 2030 et 2060 pour les données d’image de faible qualité.

Heureusement, il reste des solutions. Par exemple, les développeurs d’intelligences artificielles pourraient améliorer les algorithmes pour utiliser plus efficacement les données dont ils disposent. Une autre solution serait de puiser dans le contenu hors-ligne des textes qui ne sont pas publiés sur internet. Mis à disposition sous format numérique, il pourrait s’agir d’une autre source de données. 

Bien évidemment, les développeurs se heurtent (à raison) aux ayants droit qui se sont déjà rebellés en justice contre les entreprises qui utilisent leur contenu sans autorisation. Par exemple, l’auteur de Game of Thrones s’est retourné contre ChatGPT. Maintenant que la hype autour de l’intelligence artificielle est passée, il est temps de penser à son futur qui s’annonce moins simple qu’annoncé.

👉 Vous utilisez Google News ? Ajoutez Tom's Guide sur Google News et sur Whatsapp pour ne rater aucune actualité importante de notre site.

Votre Newsletter Tom's Guide

📣 Souscrivez à notre newsletter pour recevoir par email nos dernières actualités !