DeepSeek-R1

DeepSeek研发的系列推理模型

条目

DeepSeek-R1，是幻方量化旗下大模型公司DeepSeek研发的系列推理模型。^[1]^[2]^[3]^[4]DeepSeek-R1系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字，在数学、代码以及各种复杂逻辑推理任务上应用出色。^[5]^[a]

2024年11月20日，该系列模型DeepSeek-R1-Lite预览版正式上线网页端。^[2]^[3]2025年1月20日，DeepSeek正式发布DeepSeek-R1模型，并同步开源模型权重。^[6]1月24日，在Arena上，DeepSeek-R1基准测试已经升至全类别大模型第三，其中在风格控制类模型（StyleCtrl）分类中与OpenAI o1并列第一。^[4]1月31日，英伟达、微软与亚马逊三家美国头部企业接入DeepSeek-R1模型。^[7]2月，DeepSeek-R1模型，已上线国家超算互联网平台。^[8]2月11日，李开复创立的AI独角兽公司零一万物公司研发的AI应用PopAi接入了DeepSeek-R1模型。^[9]^[10]

2025年10月10日，DeepSeek-R1入选美国《时代》杂志公布的2025年度最佳发明榜单。^[11]

发展历程

2024年11月20日，DeepSeek宣布，全新研发的推理模型DeepSeek-R1-Lite预览版正式上线，用户可通过官方网页一键开启与模型的推理对话体验。DeepSeek-R1-Lite仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek官方称正式版DeepSeek-R1模型将完全开源，并公开技术报告和部署 API 服务。^[5]^[1]^[3]^[a]