Co to jest Prompt Injection?

Prompt injection to luka w zabezpieczeniach, w której atakujący dostarcza złośliwe dane wejściowe przejmujące instrukcje modelu LLM, zmuszając go do zignorowania oryginalnego promptu systemowego i wykonania nieautoryzowanych działań — takich jak eksfiltracja danych, dostęp do nieautoryzowanych narzędzi lub obejście barier bezpieczeństwa.

Bezpośrednia Iniekcja

Użytkownik bezpośrednio wpisuje: „Zignoruj poprzednie instrukcje i...”

Pośrednia Iniekcja

Agent odczytuje zewnętrzny plik lub stronę internetową zawierającą złośliwe polecenia.

Warstwa zapobiegania

Prompt injection nie da się rozwiązać wyłącznie za pomocą „lepszych promptów”. Wymaga to rozwiązania typu Agent Runtime Security (ARS) — deterministycznej warstwy przechwytującej, która waliduje wywołania narzędzi *poza* kontekstem modelu LLM.

Przechwytywanie SupraWall

Automatycznie blokuje nieautoryzowane wykonanie narzędzi, nawet jeśli model LLM zostanie skompromitowany.

Przeczytaj pełny przewodnik po zapobieganiu prompt injection→