安全,  新闻

隐匿学习:语言模型通过数据中的隐藏信号传递行为特征

作者:Alex Cloud, Minh Le, James Chua, Jan Betley, Anna Sztyber-Betley, Jacob Hilton, Samuel Marks, Owain Evans
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/html/2507.14805v1
摘要
我们研究了一种名为“隐匿学习”的现象,即语言模型可以通...

留言

您的邮箱地址不会被公开。 必填项已用 * 标注