安全,  新闻

基于内容的攻击:自动化事实核查是一个人工智能安全问题

作者:Michael Schlichtkrull
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/pdf/2510.11238
摘要
当人工智能代理检索外部文档并进行推理时,攻击者可能会操纵它们接收的数据以破坏其行为。先前的研究探讨了间接提示注入攻击,即攻击者注入恶意指令。我们认为,操纵代理并不需要注入指令——攻击者反而可以提供带有偏见、误导性或虚假的信息。我...

留言

您的邮箱地址不会被公开。 必填项已用 * 标注