Qu'est-ce que l'injection de prompts ?

L'injection de prompts est une vulnérabilité de sécurité où un attaquant fournit une entrée malveillante qui détourne les instructions d'un LLM, le forçant à ignorer son prompt système d'origine et à exécuter des actions non autorisées, telles que l'exfiltration de données, l'accès à des outils non autorisés ou le contournement des garde-fous de sécurité.

Injection Directe

L'utilisateur tape directement "Ignore les instructions précédentes et..."

Injection Indirecte

L'agent lit un fichier externe ou une page Web contenant des commandes malveillantes.

La couche de prévention

L'injection de prompts ne peut pas être résolue uniquement par de "meilleurs prompts". Elle nécessite une Sécurité d'Exécution de l'Agent (ARS) — une couche d'interception déterministe qui valide les appels d'outils *en dehors* du contexte du LLM.

Interception SupraWall

Bloque automatiquement l'exécution d'outils non autorisés même si le LLM est compromis.