安全, 新闻 哥德尔测试:大型语言模型能否解决简单猜想? 2025年9月26日 / 作者:Moran Feldman, Amin Karbasi 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2509.18383v1 摘要 前沿人工智能模型实验室近期发布的公告显示,其模型在高中和本科数学竞赛中取得了优异成绩。然而,大型语言模型能否在更高级的数学领域解决新的简单猜想,目前仍不明确。为此,我们提出“哥德尔测试”:评估模型能否为极简单且...