Wat is Prompt-injectie?

Prompt-injectie is een beveiligingslek waarbij een aanvaller kwaadaardige invoer levert die de instructies van een LLM kaapt. Hierdoor negeert het model de oorspronkelijke systeem-prompt en voert het ongeautoriseerde acties uit, zoals het exfiltreren van gegevens, het openen van ongeautoriseerde tools of het omzeilen van veiligheidsmaatregelen.

Directe Injectie

De gebruiker typt rechtstreeks: "Negeer vorige instructies en..."

Indirecte Injectie

De agent leest een extern bestand of een webpagina met kwaadaardige commando's.

De preventielaag

Prompt-injectie kan niet worden opgelost met alleen "betere prompts". Het vereist Agent Runtime Security (ARS) — een deterministische onderscheppingslaag die tool-aanroepen *buiten* de LLM-context valideert.

SupraWall Onderschepping

Blokkeert automatisch ongeautoriseerde uitvoering van tools, zelfs als de LLM is gecompromitteerd.