Cos'è la Prompt Injection?

La prompt injection è una vulnerabilità di sicurezza in cui un malintenzionato fornisce input dannosi che dirottano le istruzioni di un LLM, costringendolo a ignorare il prompt di sistema originale e a eseguire azioni non autorizzate, come l'esfiltrazione di dati, l'accesso a tool non autorizzati o l'aggiramento dei guardrail di sicurezza.

Iniezione Diretta

L'utente digita direttamente "Ignora le istruzioni precedenti e..."

Iniezione Indiretta

L'agente legge un file esterno o una pagina web contenente comandi dannosi.

Il livello di prevenzione

La prompt injection non può essere risolta solo con "prompt migliori". Richiede l'Agent Runtime Security (ARS): un livello di intercettazione deterministico che convalida le chiamate ai tool *al di fuori* del contesto del modello LLM.

Intercettazione SupraWall

Blocca automaticamente l'esecuzione di tool non autorizzati anche se l'LLM è compromesso.