谷歌发布Nano Banana Pro，强化推理与多语言文字生成能力

谷歌日前宣布，正式推出Nano Banana Pro（Gemini 3 Pro Image），这是基于Gemini 3 Pro构建的新一代图像生成与编辑模型，主打更强的推理能力、更高保真度的视觉内容，以及跨语言的精确文字渲染。

相比年初面向休闲创作者的Nano Banana，Nano Banana Pro能够在理解内容、处理复杂指令及融合实时信息方面提供更高准确度。用户可利用该模型将想法转化为视觉原型、根据手写笔记生成结构化图表，或制作数据说明与信息图示。依托Gemini 3的推理框架，新模型可结合真实世界知识生成更具上下文的图像内容，并可在需要时调用搜索结果呈现实时信息，如天气状况、菜谱步骤或体育赛事数据。

在文字生成方面，Nano Banana Pro能够在图像中呈现更清晰、更准确的多语言文案，适用于长段落的版式设计与内容本地化任务；字体、材质和书写风格的控制能力也得到增强，可用于Mockup、海报等创意场景。模型支持最多14张图像的内容融合，并可保持多达5个人物的视觉一致性，适合从草图到3D结构的多阶段制作需求。

在专业创作上，Nano Banana Pro支持局部编辑，可调整镜头角度、景深、色彩与光线，并提供2K及4K分辨率输出，适配社交媒体与印刷使用场景。

据悉，该模型将陆续在Gemini应用、NotebookLM、Google Ads、Workspace（包括Slides和Vids）、Google AI Studio、Vertex AI及Antigravity中上线。免费用户将获得有限使用额度，高级订阅用户可获得更高配额；Gemini应用中的AI Mode及Flow影视工具也将同步支持Nano Banana Pro。

值得一提的是，所有通过谷歌工具生成的图像均嵌入SynthID数字水印。Gemini应用现支持上传图像并查询其是否由谷歌AI生成。免费用户与Google AI Pro订阅用户生成的图像将保留可见水印，而Google AI Ultra订阅用户及Google AI Studio的开发者可获得无可见水印版本。谷歌表示，SynthID未来将扩展至音频与视频内容。

谷歌发布Nano Banana Pro，强化推理与多语言文字生成能力

你可能会喜欢

有人创业像做梦，Bhout从一场梦开始创业

阿里千问团队技术负责人林俊旸离职

3年培养10万名AI双语人才，新加坡启动国家AI影响力计划

中兴发布AI电子萌宠iMoochi｜ MWC 2026