安全,  新闻

表情符号攻击:LLM 安全防线的隐蔽威胁

表情符号作为全球通用的视觉沟通语言,已深度融入数字交流场景。其 Unicode 标准化特性使其能被 LLM 解析为合法 token,但 LLM 对表情符号的语义理解存在天然缺陷 —— 既难以精准捕捉其文化语境差异,又容易被恶意构造的表情序列误导。这种特性让表情符号攻击具备极强的隐蔽性:攻击者通过将恶意指令与表情符号融合,可规避关键词过滤,诱导 LLM 生成暴力指导、恶意代码等违规内容。

留言

您的邮箱地址不会被公开。 必填项已用 * 标注