安全,  新闻

通过自信息重写攻击揭示文本水印的弱点

作者:Yixin Cheng,Hongcheng Guo,Yangming Li,Leonid Sigal
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/pdf/2505.05190v1
摘要
文本水印旨在通过控制大型语言模型(LLM)的采样过程,将统计信号微妙地嵌入文本中,使水印检测器能够验证输出是否由指定模型生成。这些水印算法的鲁棒性已成为评估其有效性的...

留言

您的邮箱地址不会被公开。 必填项已用 * 标注