DeepSeek-R1：通过强化学习激发大型语言模型的推理能力

作者：DeepSeek-AI
译者：知道创宇404实验室翻译组
原文链接：https://arxiv.org/pdf/2501.12948
摘要
通用推理是人工智能领域一项长期且艰巨的挑战。近年来，以大型语言模型（LLMs）（Brown 等人，2020；OpenAI，2023）和思维链提示（Wei 等人，2022b）为代表的突破性进展，在基础推理任务上取得了显著成功。然而，这种成功高度依赖大...

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

留言 取消回复

留言取消回复