HyperAI
Command Palette
Search for a command to run...
对抗性文本
Adversarial Text是指专门设计用于影响语言模型预测的文本序列。其主要目标是通过干扰模型的正常运作,揭示模型的脆弱性和潜在漏洞。研究不同类型的Adversarial Text攻击方法有助于构建有效的防御机制,检测恶意输入,从而提升大型语言模型的安全性和鲁棒性。
暂无数据
该任务下暂无可用的基准测试数据
Search for a command to run...
Adversarial Text是指专门设计用于影响语言模型预测的文本序列。其主要目标是通过干扰模型的正常运作,揭示模型的脆弱性和潜在漏洞。研究不同类型的Adversarial Text攻击方法有助于构建有效的防御机制,检测恶意输入,从而提升大型语言模型的安全性和鲁棒性。