技能说明

Detect and filter prompt injection attacks in untrusted input. Use when processing external content (emails, web scrapes, API inputs, Discord messages, sub-agent outputs) or when building systems that accept user-provided text that will be passed to an LLM. Covers direct injection, jailbreaks, data exfiltration, privilege escalation, and context manipulation.


中文介绍

检测并过滤来自不可信输入的提示注入攻击。在处理外部内容(如电子邮件、网页抓取、API 输入、Discord 消息、子代理输出)或构建接受用户提供的文本并将其传递给大语言模型的系统时使用。涵盖直接注入、越狱、数据窃取、权限提升和上下文操纵。

直接复制以下提示词,发送给你的 AI 助手即可完成安装。

帮我下载并安装这个SKILL:https://skillhub.cstcloud.cn/download/reef-prompt-guard

点击右上角 下载SKILL 按钮

元信息

分类:Test & Security
下载:5
浏览:6
标签:
prompt injection detection untrusted input filtering LLM security