百川大模型

百川智能研发的大语言模型
百川大模型是由百川智能推出的大模型产品。[3]它融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,支持多轮对话、内容生成、文章摘要、知识问答、代码生成、指令跟随、数学与逻辑推理等多元化场景。[1]
百川智能是中国大模型的独角兽公司,截至2023年12月已发布七款大模型,包括四款开源大模型Baichuan-7B/13B,Baichuan2-7B/13B,两款闭源大模型Baichuan-53B、Baichuan2-53B以及Baichuan2-192K。[1][5]
社区[a],Baichuan系列是全球下载量最高的开源大模型之一。截至2023年12月,百川大模型已经被下载了超过500万次。自Baichuan-53B模型发布以来,已经有200多家企业申请部署试用百川开源模型。[7]

发展历程

2023年4月10日,搜狗创始人、前CEO王小川在社交媒体发文称,成立大语言模型公司百川智能,主要的业务方向为研发并提供通用人工智能服务。[4]