谷歌于2023年12月发布的人工智能模型
Gemini是谷歌公司开发的一款人工智能AI模型,该模型于2023年12月6日推出Gemini1.0版本,[1]包括Gemini Ultra、Gemini Pro和Gemini Nano三个不同规格。[4] 谷歌于2023年4月就开启了OpenAI的研究计划,合并了两个大型人工智能团队。[5]2023年8月,谷歌在其面向印度和日本用户的搜索工具中引入了生成式人工智能,并于9月,向少数公司开放了其对话式人工智能软件Gemini的早期版本。[6]2023年12月6日,在一段官方公布的视频中,谷歌正式推出Gemini 1.0版本,包括Gemini Ultra、Gemini Pro、Gemini Nano三种不同的规格[7]。2024年2月15日,谷歌发布Gemini 1.5[8]。5月15日,谷歌更新升级Gemini1.5Pro版本,同时推出Gemini1.5Flash轻量化小模型。[9]2025年3月26日,谷歌发布Gemini 2.5系列人工智能推理模型。[10]11月18日,谷歌正式推出Gemini 3系列模型。[11]12月12日,谷歌宣布正式将Gemini翻译能力引入翻译应用以及文本翻译应用。[12]12月18日,谷歌推出人工智能模型Gemini 3 Flash。[13]2026年1月12日,苹果发表声明,其新AI版Siri选择Gemini驱动。[14]2月18日,谷歌宣布Gemini应用已配备音乐生成模型Lyria 3,用户可使用文本、图像或视频制作30秒的音乐片段。[15]2月20日,谷歌正式推出升级核心模型Gemini 3.1 Pro,并全面接入旗下消费级与开发者产品,让这项智能升级真正落地到日常应用中。[16] Gemini内置了谷歌自研AI超算芯片Cloud TPU V5P,[17]它是第一个在MMLU基准上优 于人类专家的模型。[18]基于从头开始构建的多模型,[19]使得它能够同时识别文本、图像、音频、视频和代码五种类型信息,[20]还可以理解并生成流行的编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。[19] 发展历程
2023年4月,Alphabet(谷歌母公司)[a]首席执行官桑达尔皮查伊(Sundar Pichat)合并了两个大型人工智能团队,开启OpenAI计划。[5]2023年5月,谷歌在开发者大会上透露正在开发AI大模型Gemini。[1]2023年8月,谷歌在其面向印度和日本用户的搜索工具中引入了生成式人工智能,该工具将向提示性语言和摘要中显示文本或可视化结果,同时,它还以每位用户每月30美元的价格向企业客户提供其人工智能工具。2023年9月15日,The Information报道称,谷歌已经向少数公司开放了其对话式人工智能软件Gemini的早期版本。[6]这些早期合作旨在创建新的、创新的方式来使用Bard,探索聊天机器人、虚拟助手和教育工具等应用场景。2023年11月16日,谷歌表示推迟发布AI模型Gemini。[21]