8 月 7 日,Google I/O Connect China(2024 Google 开发者大会)如约而至。作为全球最具活力的开发者群体之一,中国开发者始终紧跟技术创新的浪潮,凭借卓越的创新能力和对用户需求的深刻洞察,借助谷歌在 AI、Web、Mobile、Cloud 等领域的最新技术进展、开发工具的革新和触达全球的平台,打造出了众多风靡全球的产品和体验。

据了解,过去一年,来自中国的 25 个开发团队,共有 31 款游戏和应用,在全球不同地区,斩获了 50 个 Google Play 年度最佳奖项。

谷歌大中华区总裁陈俊廷强调,中国开发者一直是全球舞台上不可或缺的先锋力量。在 AI 赋能的时代,充满创新精神的广大出海开发者,始终不断探索,积极打造创新产品和应用让全球用户受益。

Gemini的工具化和技术更新

人工智能正在彻底改变软件开发的基础,包括我们构建的所有灵感和新方法。谷歌致力于让生成式AI对全球每一个开发者都易于获取。AI让所有人都能更具创新性和生产力。

Google Developer X 和开发者关系副总裁兼总经理 Jeanine Banks 在大会上详细介绍了 Google AI 赋能的开发者工具和产品,谷歌推出了不同尺寸的Gemini模型系列,供大家根据自己的需求选择。例如,Gemini是最有效的移动设备端模型,它直接在手机上运行,提供低延迟响应和更好的数据隐私保护。

谷歌还为所有使用Gemini1.5 Pro的开发者开放了200万个token的上下文窗口,反馈非常积极。更长的上下文窗口为模型性能提升和新用例开辟了新的可能性。如果你是专业开发者,可以立即在Google AI Studio中尝试所有新的Gemini模型,这是开始使用谷歌最强大AI模型的最快方式。使用这个工具可以免费开始与Gemini模型交互。

谷歌还提供了Gemma,这个开放模型家族建立在与Gemini相同的基础设施上。Gemma已经支持多种语言,并在全球范围内扩展。下一代Gemma包括9亿和270亿参数尺寸的模型,比第一代更强大高效,并内置了重要的安全特性。

谷歌还升级了会说话的虚拟狗模型,现在它不仅能说话,还能通过新一代Gemma和轻量级开放视觉语言模型看到周围的环境。

谷歌的Gemini已经集成到许多开发者喜欢的开发工具和服务中,比如 Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ 和 Firebase。这些集成对人们很有帮助,比如APP设置、性能、数据、日志,甚至是开发者的整个代码库。它们可以帮助你编写、调试和测试代码,或生成文档,以及理解你的代码库。

全套应用开发工具和服务让跨平台构建更高效

中国是全球Flutter开发前三的国家之一。 为了提供美观、快速和高质量的跨平台用户体验。谷歌刚刚发布了Flutter3.24和Dart3.5,其中包括改进的平台视图和MacOS上的Web视图性能,以及一个名为Clever GPU的新功能早期预览版。这个内置于Clever SDK的API让开发者可以使用Dart代码访问GPU,实现新的性能和图形渲染控制水平。

为了简化这个新API的使用,谷歌构建了像“flutter-scenes”这样的package。有了这个新package,你可以直接将行业标准的3D模型导入到你的Flutter应用中。利用相关引擎,它在iOS、MacOS和Android设备上都能流畅运行。

许多最具创新性的Flutter应用都来自中国。例如,今年早些时候发布的小米 Su7,它的车载应用就是用Flutter构建的。小米汽车的应用程序提供了一整套功能,包括远程车辆控制接收车辆状态的实时更新等。小米汽车后排可以悬挂平板电脑,安装另外一款小米汽车拓展平台,同样使用了Flutter进行开发,小米方面表示上手Flutter非常容易并且进展迅速,并预估比使用原生框架的效率要高60%,通过Flutter的卓越性能和高度可定制的UI组件,小米在iOS和安卓平台上很快交付了具有出色的用户体验的应用。

谷歌的开发产品套件为开发人员提供了全面的支持,确保了应用在可靠性、合规性和安全性方面的要求。Firebase Al Monitoring 信息中心可实时监控你使用大语言模型构建的功能在生产环境中的性能和行为,此产品已经与 Genkit无缝集成。新推出的 Checks Al Safety可以用于评估、监控和监督 AI 模型和代理的合规性,让开发合规且安全的应用变得更加容易。

功能强大且更易开发的 Web 是怎样炼成的

设备端 AI 模型,能为开发者带来更低的成本、更少的容量限制和更强的数据隐私保护的 AI 解决方案。Chrome 开发技术推广部主管 Paul Kinlan 与大家分享了 AI 如何重塑 Web 平台。

从调制解调器到宽带的转变,从桌面到移动设备,现在网络在人工智能的助力下已准备好迎接新一代的变革。网络对于实现信息全球覆盖至关重要,而设备上的执行对于精确服务受众和AI功能至关重要。设备上的AI是提供云中AI模型的理想补充,使开发者能够以更低的成本提供AI解决方案。

对此,谷歌已经投入了大量资源,以确保模型能够快速高效地运行,例如在网络GPU中使用16位浮点值和JavaScript等承诺集成等改进。我们正在使AI在更广泛的硬件上运行得更快,无论是开发者使用Tensor项目、One Transform JS、Media Pipe还是任何其他AI库,网络汇编和网络GPU都能让开发者在全球绝大多数设备上大规模运行模型。

在设备上运行AI模块的好处显而易见。从Chrome 126开始,Gemini Nano已经内置在Chrome桌面本身中。谷歌使用Gemini来启用Chrome的语音功能,包括像”帮助我写”这样的功能,它使用设备上的AI帮助海外用户编写产品评论、社交媒体帖子和客户反馈等内容。为了提供这个功能,谷歌对Gemini的最高效版本进行了微调,并对Chrome进行了优化,以便快速加载该模型。

现在,谷歌方面希望向开发者提供在Chrome内部的这些Gemini模型的访问权限。按照设想,开发者将能够向数十亿用户交付强大的AI功能,而不必担心提示工程、微调能力或成本。开发者所要做的就是调用一些非常简单的高级API,如翻译、字幕或转录。

在移动领域帮助创新和提高生产力

谷歌助力开发者以 AI 为核心,简化复杂的开发任务,提高开发效率。Android 开发技术推广部主管史婧羽分享了 Mobile 的最新动态,这些更新将使开发者能够更高效地构建智能化、性能卓越的移动应用,推动移动应用开发进入一个全新的时代。

Gemini Nano 适用于在移动设备端运行,提供低延迟响应和数据隐私保护。例如在聊天应用中实现智能回复等功能同时确保数据不会离开设备端。即使在没有蜂窝网络覆盖的情况下,Gemini Nano 也能保证 AI 功能的可用性。

OPPO 选择了谷歌的 Gemini 模型,并与谷歌一起在海外市场推出了一系列生成式 AI 功能。首先是音频和会议摘要功能Gemini 1.5 Pro 提供了超长输入的 AI录音摘要功能,极大提高了工作效率。此外,OPPO 团队基于 Gemini 1.5 Flash开发了 AI工具箱中的一些功能,集成在ColorOS 智能侧边栏中,方便用户调用。

智能融合的跨云体验

为了帮助开发者更快速、更轻松、更安全地构建高品质应用,Google Cloud 首席布道师 Richard Seroter 介绍了 Google Cloud 的五个先进特性。

首先,Google Cloud 通过自动化、多功能、规模拓展、深度集成,为用户提供了全新的构建方式。如 GKE的 Fleets和 Autopilot模式,BigQuery 的集成式分析体验,以及VertexAl的一站式 A!服务,都展现了这种新范式的强大能力。

Google Cloud 不仅集成了谷歌和业界的最佳实践,还赋予用户足够的自由度去选择最适合自己的技术和方案。这种平衡使得用户能够在遵循最佳实践的同时,灵活应对特定需求。比如VertexAl 的模型多样性,以及与 Hugging Face 模型库的集成,赋能用户在Google Cloud 平台上自由选择和使用各种模型。

其次,Google Cloud 通过自动化和智能默认设置,简化了云基础设施的搭建和管理过程。这使得开发者能够更加专注于业务逻辑和应用功能的开发,而不是被繁琐的基础设施配置所困扰。现在开发者可以在 45分钟内搭建起生产级的云基础设施,实现多方面功能。

而且Google Cloud 致力于打破专有技术的壁垒,让用户能够轻松地在不同云平台之间迁移和管理资源。这种跨云能力提高了资源的灵活性和可用性。比如BigQuery Omni 就允许用户在多个主流云平台上运行 BigQuery 而无需迁移数据;AloyDB Omni 则提供了无限制的数据库部署环境,进一步增强了跨云能力。

最后,Gemini for Google Cloud 深度融入云体验,包括 IDE 插件提供代码生成、补全、解释和测试生成等功能,就连 Cloud 控制台也能随时答疑解惑;Gemini in Databases将 AI 智能融入 SQL 生成、数据库操作等任务,让数据处理更加智能高效。

AI 向善

据介绍,谷歌公益的志愿者协助爱百福基于Google Cloud,开发和部署了一个全球可用的平台来生成视障儿童可以看清的内容,并应用 MediaPipe框架、Gemini1.5 Flash、lmagen 模型和 Google Cloud文本转语音技术,为视障儿童高效生成了图文并茂的学习视频。

谷歌大中华区总裁陈俊廷表示,AI 推动的进步不仅限于尖端生产力,在促进文化传承与造福社会上,同样有无限可能。广西民族大学运用谷歌全球 AI 开源技术,保护和传承少数民族非物质文化遗产;在四川的高原牧场,西南民族大学借助谷歌 AI 开源技术,改善了当地牧民的生活;谷歌公益与欣欣教育基金会合作,通过 “编译梦想” 项目为 26 所偏远地区小学的 900 多名学生提供 AI 入门教育。