HyperAI超神经

对抗性提示 Adversarial Prompting

对抗性提示是提示工程中的一个重要主题,因为它可以帮助理解 LLMs 涉及的风险和安全问题。识别这些风险并设计技术来解决这些问题也是一门重要的学科。当构建 LLMs 时,防止可能绕过安全护栏并破坏模型指导原则的即时攻击非常重要。