在 6 月份的 I / O 开发者大会上,Google CEO 皮查伊首次透露 Gemini 的存在,现在正式面向公众推出。Google 表示,这是其迄今为止功能最强大、最通用的大语言模型。

根据 Google 给出的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

Google 针对不同场景发布了三种不同版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。这些不同的版本也将适用于不同的场景和案例:

  • Gemini Ultra – 用于处理高度复杂任务的最强、最大的模型。
  • Gemini Pro – 用于扩展各种任务的最佳模型。
  • Gemini Nano – 用于手机等设备的最高效模型。

从 12 月 13 日开始,开发者和企业客户将可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 的 Gemini API。

Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈,并计划于明年初向开发者和企业客户推出。

Gemini 与 GPT-4 比较

Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中有 30 个都表现出了超越当前时代的“先进结果”,而这些基准测试也是当前 LLM 领域最常用、最泛用的测试。

其中,它以 90.0% 的得分成为第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型(该测试结合了数学、物理、历史、法律、医学和伦理等 57 个学科)。

Gemini Ultra 还在新的 MMMU 基准测试上表现出了 59.4% 的领先级性能,该测试涵盖了“需要深思熟虑的”不同领域的多模态任务。

Google 表示,其 Bard 将借助 Gemini Pro 版本进行更高级的强化,涉及逻辑推理、规划和理解等功能。它将在超过 170 个国家和地区提供服务,并计划在未来扩展到不同的模态,并支持更多语言和地区。

此外,明年初将推出全新升级的 Bard Advanced,让用户可以更好地体验到其最好的模型和功能,也就是 Gemini Ultra。

据介绍,Android 开发人员还将能够借助 AICore(一种在 Android 14 中提供的全新系统功能)构建 Gemini Nano,终端设备则将率先支持 Pixel 8 Pro 系列机型。

在接下来的几个月里,Gemini 将应用于更多的产品和服务,例如搜索、广告、Chrome 和 Duet AI 等等。