// GLOSSAIRE IA

Sécurité & Confidentialité, Technique

Injection de prompt

Définition

L’injection de prompt, c’est une attaque où l’on glisse des instructions cachées dans un contenu pour détourner une IA de sa consigne d’origine.

L'injection de prompt, c'est une attaque où l'on glisse des instructions cachées dans un contenu pour détourner une IA de sa consigne d'origine. Par exemple, un texte piégé qui dit au modèle d'ignorer ses règles ou de divulguer des données. C'est un risque majeur des agents qui lisent du contenu externe. S'en protéger passe par des garde-fous et une méfiance par défaut envers les entrées.

Exemple – Une page web piégée tente, par injection de prompt, de faire révéler ses instructions secrètes à un agent qui la lit.

Questions fréquentes

Comment se protéger d'une injection de prompt ?
Aucune parade unique ne suffit. On combine : garde-fous, méfiance par défaut envers tout contenu externe, principe du moindre privilège sur les outils, et séparation nette entre instructions de confiance et données non fiables.

C'est différent du jailbreak ?
Proche mais distinct. Le jailbreak vise à faire sortir le modèle de ses règles via l'utilisateur ; l'injection de prompt glisse les instructions piégées dans un contenu que l'IA lit (page web, document, e-mail).

Pourquoi les agents y sont-ils plus exposés ?
Un agent qui lit des pages, des mails ou se branche via MCP ingère du contenu externe non contrôlé : c'est exactement le vecteur d'une injection.

À lire aussi – garde-fous et MCP.

Tu veux cadrer où ça s'insère dans ta PME sans rester dans le jargon ? Découvre le parcours iamin (diagnostic et feuille de route concrète).

→ Voir tous les termes : Glossaire IA