Google 发布大语言模型 Gemini，希望与 OpenAI GPT-4 抗衡

在 6 月份的 I / O 开发者大会上，Google CEO 皮查伊首次透露 Gemini 的存在，现在正式面向公众推出。Google 表示，这是其迄今为止功能最强大、最通用的大语言模型。

根据 Google 给出的基准测试结果，Gemini 在许多测试中都表现出了“最先进的性能”，甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。

Google 针对不同场景发布了三种不同版本：Gemini Ultra、Gemini Pro 和 Gemini Nano。这些不同的版本也将适用于不同的场景和案例：

从 12 月 13 日开始，开发者和企业客户将可以通过 Google AI Studio 或 Google Cloud Vertex AI 访问 Gemini Pro 的 Gemini API。

Gemini Ultra 目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈，并计划于明年初向开发者和企业客户推出。

Gemini 与 GPT-4 比较

Gemini Ultra 的性能在 32 个广泛使用的学术基准测试中有 30 个都表现出了超越当前时代的“先进结果”，而这些基准测试也是当前 LLM 领域最常用、最泛用的测试。

其中，它以 90.0% 的得分成为第一个在 MMLU（大规模多任务语言理解）上超越人类专家的模型（该测试结合了数学、物理、历史、法律、医学和伦理等 57 个学科）。

Gemini Ultra 还在新的 MMMU 基准测试上表现出了 59.4% 的领先级性能，该测试涵盖了“需要深思熟虑的”不同领域的多模态任务。

Google 表示，其 Bard 将借助 Gemini Pro 版本进行更高级的强化，涉及逻辑推理、规划和理解等功能。它将在超过 170 个国家和地区提供服务，并计划在未来扩展到不同的模态，并支持更多语言和地区。

此外，明年初将推出全新升级的 Bard Advanced，让用户可以更好地体验到其最好的模型和功能，也就是 Gemini Ultra。

据介绍，Android 开发人员还将能够借助 AICore（一种在 Android 14 中提供的全新系统功能）构建 Gemini Nano，终端设备则将率先支持 Pixel 8 Pro 系列机型。

在接下来的几个月里，Gemini 将应用于更多的产品和服务，例如搜索、广告、Chrome 和 Duet AI 等等。