Co to jest Prompt Injection?
Prompt injection to luka w zabezpieczeniach, w której atakujący dostarcza złośliwe dane wejściowe przejmujące instrukcje modelu LLM, zmuszając go do zignorowania oryginalnego promptu systemowego i wykonania nieautoryzowanych działań — takich jak eksfiltracja danych, dostęp do nieautoryzowanych narzędzi lub obejście barier bezpieczeństwa.
Bezpośrednia Iniekcja
Użytkownik bezpośrednio wpisuje: „Zignoruj poprzednie instrukcje i...”
Pośrednia Iniekcja
Agent odczytuje zewnętrzny plik lub stronę internetową zawierającą złośliwe polecenia.
Warstwa zapobiegania
Prompt injection nie da się rozwiązać wyłącznie za pomocą „lepszych promptów”. Wymaga to rozwiązania typu Agent Runtime Security (ARS) — deterministycznej warstwy przechwytującej, która waliduje wywołania narzędzi *poza* kontekstem modelu LLM.
Przechwytywanie SupraWall
Automatycznie blokuje nieautoryzowane wykonanie narzędzi, nawet jeśli model LLM zostanie skompromitowany.