安全,  新闻

DeepSeek-R1:通过强化学习激发大型语言模型的推理能力

作者:DeepSeek-AI
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/pdf/2501.12948
摘要
通用推理是人工智能领域一项长期且艰巨的挑战。近年来,以大型语言模型(LLMs)(Brown 等人,2020;OpenAI,2023)和思维链提示(Wei 等人,2022b)为代表的突破性进展,在基础推理任务上取得了显著成功。然而,这种成功高度依赖大...

留言

您的邮箱地址不会被公开。 必填项已用 * 标注