Wat is Prompt-injectie?
Prompt-injectie is een beveiligingslek waarbij een aanvaller kwaadaardige invoer levert die de instructies van een LLM kaapt. Hierdoor negeert het model de oorspronkelijke systeem-prompt en voert het ongeautoriseerde acties uit, zoals het exfiltreren van gegevens, het openen van ongeautoriseerde tools of het omzeilen van veiligheidsmaatregelen.
Directe Injectie
De gebruiker typt rechtstreeks: "Negeer vorige instructies en..."
Indirecte Injectie
De agent leest een extern bestand of een webpagina met kwaadaardige commando's.
De preventielaag
Prompt-injectie kan niet worden opgelost met alleen "betere prompts". Het vereist Agent Runtime Security (ARS) — een deterministische onderscheppingslaag die tool-aanroepen *buiten* de LLM-context valideert.
SupraWall Onderschepping
Blokkeert automatisch ongeautoriseerde uitvoering van tools, zelfs als de LLM is gecompromitteerd.