哥德尔测试：大型语言模型能否解决简单猜想？

作者：Moran Feldman, Amin Karbasi
译者：知道创宇404实验室翻译组
原文链接：https://arxiv.org/html/2509.18383v1
摘要
前沿人工智能模型实验室近期发布的公告显示，其模型在高中和本科数学竞赛中取得了优异成绩。然而，大型语言模型能否在更高级的数学领域解决新的简单猜想，目前仍不明确。为此，我们提出“哥德尔测试”：评估模型能否为极简单且...

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

留言 取消回复

留言取消回复