安全, 新闻 隐匿学习:语言模型通过数据中的隐藏信号传递行为特征 2025年7月24日 / 作者:Alex Cloud, Minh Le, James Chua, Jan Betley, Anna Sztyber-Betley, Jacob Hilton, Samuel Marks, Owain Evans 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2507.14805v1 摘要 我们研究了一种名为“隐匿学习”的现象,即语言模型可以通...