ChatGPT : une faille de sécurité insoluble plombe le futur des chatbots

Antoine Barsacq , le 11 septembre 2023

Que ce soit ChatGPT, Bing ou Bard, aucun chatbot n’échappe à cette faille de sécurité insoluble qui met en péril l’avenir de intelligence artificielle générative. Appelée “attaque par injection indirecte d’invite”, cette faille peut mettre n’importe quel utilisateur à la merci de pirates.

Il n’a pas fallu attendre longtemps avant que l’intelligence artificielle ne soit détournée par des acteurs mal-intentionnés. En janvier, des pirates russes se servaient déjà de ChatGPT pour mener leurs attaques. Depuis, les utilisation malfaisantes des intelligences artificielles génératives se sont multipliés et désormais, ChatGPT est capable de créer des malwares indétectables d’une redoutable dangerosité.

Contourner les mesure de sécurité mises en place par OpenAI, Google ou Microsoft n’est pas compliqué, comme l’ont montré des chercheurs en février. En effet, les chatbots comme Bing peuvent accéder aux pages web ouvertes par un utilisateur, si ce dernier l’y autorise. Un pirate peut exploiter cette faille pour dissimuler des instructions malfaisantes dans un site web visité.

Cela transforme l’IA en un formidable outil d’extraction d’informations personnelles. Dans le cas de leur expérience, les chercheurs avaient réussi à amener le chatbot à demander des informations bancaires sensibles aux utilisateurs. Ces derniers n’avaient commis aucune autre faute, mis à part d’interagir avec l’intelligence artificielle de Microsoft.

Les attaques par injection indirecte d’invite, un danger de l’IA

Les attaques par injection d’invites se divisent en deux catégories :

Les attaques directes, qui se produisent lorsqu’on essaie de faire répondre le grand modèle de langage (GML) d’une manière non voulue, par exemple en l’incitant à prononcer des discours racistes, comme GPT-4 le faisait lors des phases de test. Ce type d’attaque peut facilement être empêché.
Les attaques indirectes, comme dans l’exemple susmentionné, sont plus préoccupantes et vont encore plus loin. Au lieu que l’utilisateur saisisse lui-même une invite malveillante, l’instruction provient d’un tiers. Un site web que l’IA peut lire, ou un PDF analysé, peut contenir des instructions cachées que l’IA devrait suivre.

Dans les pages de Wired, Rich Harang, le responsable de la sécurité des systèmes d’IA de Nvidia, explique que ces attaques impliquent que la personne qui fournit les données d’apprentissage a une grande influence sur les résultats que recrache l’IA. L’intelligence artificielle est donc facilement manipulable et ses résultats peuvent vite s’avérer complètement bidons voire dangereux. Comme de plus en plus d’entreprises utilisent l’IA générative et que les employés partagent trop de secrets, le problème devient d’autant plus criant.

Comment faire pour utiliser ChatGPT en toute sécurité ?

Selon les informations de Wired, Google a lancé plusieurs projets pour comprendre comment l’IA réagit aux attaques par injection indirecte d’invite et trouver une solution. De son côté, OpenAI, l’entreprise conceptrice de ChatGPT, déclare rechercher activement une solution à cette faille. De même chez son partenaire, Microsoft, chez qui de grandes équipes travaillent sur les problèmes de sécurité.

Chez Google, les équipes utilisent l’IA pour résoudre ce problème. Le serpent se mord quasiment la queue : des modèles spécialement formés aident à identifier les prompts malveillants connus et les résultats dangereux qui violent les politiques de l’entreprise. De même, Nvidia a publié une série de garde-fous en open source à ajouter aux GML. Mais ces approches n’ont qu’une portée limitée, car il n’est pas possible d’identifier toutes les invites malveillantes.

Le National Cyber Security Center (NCSC), une branche du renseignement britannique, avertit également sur le risque d’attaques par injection. L’institution affirme que des centaines de tentatives d’attaque ont déjà rapportés. “Alors que des recherches sont en cours sur l’injection rapide, il peut s’agir d’un problème inhérent à la technologie GML“, avertit l’agence dans un billet de blog “Certaines stratégies peuvent rendre l’injection rapide plus difficile, mais il n’existe pas encore de solutions infaillibles.”

Ainsi, il n’existe pas à l’heure actuelle solution miracle, mais certaines bonnes pratiques de sécurité peuvent réduire les risques. Il faut avant tout traiter les chatbots de la même manière qu’il faut traiter un inconnu avec qui on chatte sur internet : ne pas lui révéler d’informations personnelles et surtout vérifier tout ce qu’il dit. Quoiqu’il en soit, cette dangereuse faille de sécurité met en péril l’avenir de l’intelligence artificielle générative.

Source : Wired

ChatGPT

Antoine Barsacq

Twitter LinkedIn

Pratiquement né avec une manette de Nintendo64 dans les mains, j’ai rapidement préféré la souris…

Les commentaires sont fermés.

Les derniers articles

WhatsApp teste un scanner de documents natif sur Android
30 juin 2025 17:00
Arrêts maladie frauduleux : jusqu’à 375 000 euros d’amende et 5 ans de prison
30 juin 2025 12:00
Châteauroux dans le viseur de Google : un projet à 58,5 millions d’euros en discussion
30 juin 2025 08:00
Keep, Maps, Agenda : Gemini Live prend la main sur vos applis Google
27 juin 2025 17:00
Pixel 10 : compromis techniques et premières déceptions avant son lancement
27 juin 2025 12:00
Vers la fin des pubs dans la rue ? Un bloqueur de publicités arrive pour les lunettes AR
27 juin 2025 08:00
Airbags explosifs : les autorités françaises lancent une nouvelle alerte
26 juin 2025 17:00
Abandon des zones à faibles émissions : une décision qui pourrait coûter cher à la France
26 juin 2025 12:00
Accès au site des impôts : ce qui change dès le 25 juin 2025
26 juin 2025 08:00
Fairphone 6 : un smartphone conçu pour durer et respecter la planète
25 juin 2025 17:00

ChatGPT : une faille de sécurité insoluble plombe le futur des chatbots

Les attaques par injection indirecte d’invite, un danger de l’IA

Comment faire pour utiliser ChatGPT en toute sécurité ?

La rédaction vous conseille aussi...