表情符号攻击：LLM 安全防线的隐蔽威胁

表情符号作为全球通用的视觉沟通语言，已深度融入数字交流场景。其 Unicode 标准化特性使其能被 LLM 解析为合法 token，但 LLM 对表情符号的语义理解存在天然缺陷 —— 既难以精准捕捉其文化语境差异，又容易被恶意构造的表情序列误导。这种特性让表情符号攻击具备极强的隐蔽性：攻击者通过将恶意指令与表情符号融合，可规避关键词过滤，诱导 LLM 生成暴力指导、恶意代码等违规内容。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

留言 取消回复

留言取消回复