DeepSeek-R1

DeepSeek研发的系列推理模型
DeepSeek-R1,是幻方量化旗下大模型公司DeepSeek研发的系列推理模型。[1][2][3][4]DeepSeek-R1系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字,在数学、代码以及各种复杂逻辑推理任务上应用出色。[5][a]
2024年11月20日,该系列模型DeepSeek-R1-Lite预览版正式上线网页端。[2][3]2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源模型权重。[6]1月24日,在Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。[4]1月31日,英伟达微软亚马逊三家美国头部企业接入DeepSeek-R1模型。[7]2月,DeepSeek-R1模型,已上线国家超算互联网平台。[8]2月11日,李开复创立的AI独角兽公司零一万物公司研发的AI应用PopAi接入了DeepSeek-R1模型。[9][10]
2025年10月10日,DeepSeek-R1入选美国《时代》杂志公布的2025年度最佳发明榜单。[11]

发展历程

2024年11月20日,DeepSeek宣布,全新研发的推理模型DeepSeek-R1-Lite预览版正式上线,用户可通过官方网页一键开启与模型的推理对话体验。DeepSeek-R1-Lite仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek官方称正式版DeepSeek-R1模型将完全开源,并公开技术报告和部署 API 服务。[5][1][3][a]