Open rodion-m opened 1 year ago
В помощь: https://github.com/0xk1h0/ChatGPT_DAN (посмотрите на The ANTI-DAN Prompt)
И вот это: https://github.com/utkusen/promptmap
А также книга в тему (платная): https://utkusen.gumroad.com/l/securing-gpt-attack-defend-chatgpt-applications
@ultyyp есть подозрение, что технически оптимальнее всего будет проверять запросы на предмет инжекта вообще отдельной асинхронной задачей и не смешивать логику валидации промпта с бизнес логикой. То есть нужен просто отдельный промпт, которые будет проверять каждое последнее сообщение, отправленное пользователя на prompt-injection.
Related #6