DeepSeek

2023年成立的创新型科技公司
1
4
DeepSeek(全称杭州深度求索人工智能基础技术研究有限公司,中文简称深度求索),是一家以从事研究和试验发展为主的企业,专注于开发先进的大语言模型(LLM)和相关技术。[3]同时,“DeepSeek”也是该公司开发的开放权重生成式人工智能模型及运行于该模型上的聊天机器人的名称。该公司成立于2023年7月17日,由知名量化资管巨头幻方量化创立。[4]公司位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人系裴湉[b][1][5][6]
2024年1月5日,DeepSeek发布首个大模型DeepSeek LLM。[7]5月,DeepSeek宣布开源第二代MoE大模型DeepSeek-V2,该模型因性能及价格优势让DeepSeek收获了“AI界拼多多”的名号。[8]12月26日,DeepSeek宣布模型DeepSeek-V3首个版本上线并同步开源。[9][10]
2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,该模型在性能上比肩OpenAI o1正式版。[11]1月31日,DeepSeek R1 671b已作为英伟达NIM微服务预览版在build.nvidia.com上发布。[12]2月,DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。[13]2月1日,DeepSeek日活跃用户数突破3000万大关,成为史上最快达成这一里程碑的应用。[14]
截至2025年2月2日,DeepSeek攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。[15]截至2月9日,DeepSeek App的累计下载量超1.1亿次,周活跃用户规模最高近9700万。[16]2月21日,DeepSeek宣布,会陆续开源5个代码库。[17]2月26日,Deepseek宣布开源DeepGEMM[d][18]2月27日,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略。[19]3月31日,据IndiaTimes报道,DeepSeek在2月录得了5.247亿次新的网站访问量,超越了ChatGPT,在整体规模上仍位列第三。[20]4月30日,DeepSeek于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的模型。[21]7月,根据国际半导体研究机构Semianalysis最新报告,DeepSeek的全球用户使用率已从2025年1月的50%骤降至7月的3%,官网访问量在2月至5月期间下滑63%。[22]截至9月22日,DeepSeek线上模型已升级,当前版本号为DeepSeek-V3.1-Terminus。[23]9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。[24]10月20日,DeepSeek在开源社区Hugging Face上发布了模型DeepSeek-OCR。[25]11月,DeepSeek推出数学推理模型DeepSeekMath-V2。[26]2026年1月1日,DeepSeek 公布新论文《mHC: Manifold-Constrained Hyper-Connections》,提出名为 mHC(流形约束超连接)的新架构。[27]2月27日,DeepSeek与北京大学清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。数据显示,DualPath在线服务场景下的吞吐量平均提升了1.96倍。[28]

发展历程