Cos'è la Prompt Injection?
La prompt injection è una vulnerabilità di sicurezza in cui un malintenzionato fornisce input dannosi che dirottano le istruzioni di un LLM, costringendolo a ignorare il prompt di sistema originale e a eseguire azioni non autorizzate, come l'esfiltrazione di dati, l'accesso a tool non autorizzati o l'aggiramento dei guardrail di sicurezza.
Iniezione Diretta
L'utente digita direttamente "Ignora le istruzioni precedenti e..."
Iniezione Indiretta
L'agente legge un file esterno o una pagina web contenente comandi dannosi.
Il livello di prevenzione
La prompt injection non può essere risolta solo con "prompt migliori". Richiede l'Agent Runtime Security (ARS): un livello di intercettazione deterministico che convalida le chiamate ai tool *al di fuori* del contesto del modello LLM.
Intercettazione SupraWall
Blocca automaticamente l'esecuzione di tool non autorizzati anche se l'LLM è compromesso.