正面对决GPT-4！谷歌推出“最全能”AI模型Gemini，从手机到数据中心多环境适配

今天小编分享的互联网经验：正面对决GPT-4！谷歌推出“最全能”AI模型Gemini，从手机到数据中心多环境适配，欢迎阅读。

谷歌迈出了在人工智能（AI）科技应用上追赶 OpenAI 的重要一步，推出手机、云、数据中心都可应用的超级全能 AI 模型，正面对决 GPT-4。

美东时间 12 月 6 日周三，谷歌正式向公众发布新一代大语言模型（LLM）Gemini，号称谷歌迄今为止 " 最大、也最全能的 AI 模型 "，有高级推理能力，回答难题时 " 考虑得更仔细 "。有别于其他公司 LLM 竞品的是，谷歌强调 Gemeni 是最灵活的模型，因为它用不同大小的版本，可以适用于各种生成式 AI 应用。

其中，最轻盈的版本 Gemni Nano 可以直接在智能手机上离线运行；相对而言更强大的版本 Gemini Pro 可以执行多种任务，将通过谷歌的类 ChatGPT 聊天机器人 Bard，为众多谷歌 AI 服务提供支持，加持谷歌的 Gmail、Maps Docs 和 YouTube 等服务；功能最强大的版本 Gemini Ultra 也是谷歌迄今打造的最强大 LLM，主要为数据中心和企业应用而设计。

谷歌旗下 AI 研究机构 DeepMind 的产品副总裁 Eli Collins 称，Gemini 的多样性意味着，它 " 能够在从移动设备到大型数据中心的所有设备上运行。" 他表示，谷歌早就希望打造的新一代 AI 模型更像是乐于助人的合作者，而不是一种智能的軟體，Gemini 让谷歌距离这种远景又近了一步。

现在 Gemini 只有英语版，谷歌将很快推出其他语言的版本。谷歌 CEO Sundar Pichai 说，Gemini 代表了 AI 的新时代。最终，Gemini 将与谷歌的搜索引擎、广告产品、Chrome 浏览器等更多产品结合。

Gemini Nano 手机电腦版周三可用 Gemini Pro 支持 Bard、下周面向云客户 Gemini Ultra 明年推行

具体应用时间表方面，从本周三起，安卓系统开发人员可以注册使用 Gemini Nano 版，打造智能手机和电腦的 Gemini 支持 App。谷歌称，Gemini 可以立即在其旗舰手机 Pixel 8 Pro 上启用，实现诸如归纳电话录音对话要点等新的生成式 AI 功能。

Gemini Pro 版从本周三开始支持 Bard，实现高级的推理、规划、理解等功能，在 170 个国家地区以英语一种语言操作运行，可能不包括英国或者其他欧洲地区，因为谷歌称在和当地的监管机构合作。

从 12 月 13 日下周三开始，谷歌将通过谷歌云，在旗下 Vertex AI 和 AI Studio 平台向云客户提供 Gemini Pro 版。

Gemini Ultra 将首先面向开发者和企业客户开放，该版本的应用详情将在下周公布。谷歌计划，明年初，向公众大范围开放 Gemini Ultra 应用。

谷歌还计划，明年初发布 Gemini Ultra 支持的进阶版 Bard Advanced，在面向大众推出以前，先将推出一个测试项目，以便改进 Bard Advanced。

谷歌的下图展示了 Gemini 家族三个版本。

32 种行业指标测试中 Gemini 有 30 种遥遥领先 GPT-4

谷歌此次毫不讳言和 GPT-4 一较高低的雄心。发布 Gemini 前，谷歌对它进行了一系列以标准行业指标评估的测试。谷歌称，在八项测试中，Gemini Pro 有六项的表现优于 OpenAI 的 GPT-3.5。在通用语言理解、推理、数学和编码方面测试中，八项基准指标里，Gemini 有七项超过了 OpenAI 的最新版模型 GPT-4。

同时，谷歌评估了旗下可以解释和生成代码的最新生成式 AI 产品 AlphaCode 2，发现在竞争性编程领網域，它领先 85% 的竞争对手。

DeepMind 的 CEO Demis Hassabis 称，谷歌运行了 32 种完善的基准指标相关测试，对比 Gemini 和 GPT-4 这两个模型，既有诸如多任务语言理解这类广泛的整体测试，到生成 Python 代码这种单一能力的测试。32 种基准指标种，Gemini 有 30 项都 " 遥遥领先 "。

以下谷歌报告的截图可见，在多选问题、数学问题、Python 代码任务、阅读等方面，Gemini Pro 和 Ultra 与 GPT-4、GPT-3.5 等其他 LLM 的评分对比。

Gemini 为原生多模态模型在谷歌更高性能云芯片 TPU v5p 训练

谷歌称，Gemini 是一种 " 原生多模态 "AI 模型。这意味着它从一开始就经过预先训练，可以处理用户基于文本和影像的提示词任务，支持文本和影像的服务。比如家长可以通过上传数学问题的影像，以及在工作表里尝试解决问题的照片，帮助孩子做家庭作业。Gemini 还能阅读答案，理解为何是对的、为何是错的，并解释需要进一步说明的概念。

谷歌称，谷歌搜索运用生成式 AI 技术的 " 搜索生成式体验 " 在明年融入和 Gemini 的新功能。

谷歌承认，Gemini 仍然可能存在 AI 产生的虚假信息或者捏造信息。Collins 称这是尚未解决的研究问题，不过他说，Gemini 有迄今为止谷歌 AI 模型的最全面安全评估。为评估 Gemini 的安全性，谷歌对该模型进行了对抗性测试，模仿有不良企图的用户利用该模型输入提示词，帮助研究人员检查模型中是否存在仇恨言论和政治偏见。这类测试包括 " 真实毒性提示词 "，它包含从网上提取的 10 万多个提示词。

谷歌强调 Gemini 的 AI 工具效率会非常高、速度非常快。它在谷歌自研的新版云芯片 Tensor Processing Units（TPU）上训练，TPU v5p 的性能更强，该芯片训练现有模型的速度比前代快 2.8 倍。TPU v5p 是为数据中心的训练和大模型运行而设计。

谷歌机器学习副总裁 Amin Vahdat 表示，这种方法让谷歌 " 对未来标准 AI 基础设施有了新的认识 "。谷歌仍然使用第三方 AI 芯片运行 Gemini 模型。

谷歌提供的下图可见，谷歌数据中心内成排的谷歌云 TPU v5p AI 加速器超级计算机。