安全, 新闻 DeepSeek-R1:通过强化学习激发大型语言模型的推理能力 2026年1月9日 / 作者:DeepSeek-AI 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/pdf/2501.12948 摘要 通用推理是人工智能领域一项长期且艰巨的挑战。近年来,以大型语言模型(LLMs)(Brown 等人,2020;OpenAI,2023)和思维链提示(Wei 等人,2022b)为代表的突破性进展,在基础推理任务上取得了显著成功。然而,这种成功高度依赖大...