谷歌日前宣布,正式推出Nano Banana Pro(Gemini 3 Pro Image),这是基于Gemini 3 Pro构建的新一代图像生成与编辑模型,主打更强的推理能力、更高保真度的视觉内容,以及跨语言的精确文字渲染。
相比年初面向休闲创作者的Nano Banana,Nano Banana Pro能够在理解内容、处理复杂指令及融合实时信息方面提供更高准确度。用户可利用该模型将想法转化为视觉原型、根据手写笔记生成结构化图表,或制作数据说明与信息图示。依托Gemini 3的推理框架,新模型可结合真实世界知识生成更具上下文的图像内容,并可在需要时调用搜索结果呈现实时信息,如天气状况、菜谱步骤或体育赛事数据。
在文字生成方面,Nano Banana Pro能够在图像中呈现更清晰、更准确的多语言文案,适用于长段落的版式设计与内容本地化任务;字体、材质和书写风格的控制能力也得到增强,可用于Mockup、海报等创意场景。模型支持最多14张图像的内容融合,并可保持多达5个人物的视觉一致性,适合从草图到3D结构的多阶段制作需求。
在专业创作上,Nano Banana Pro支持局部编辑,可调整镜头角度、景深、色彩与光线,并提供2K及4K分辨率输出,适配社交媒体与印刷使用场景。
据悉,该模型将陆续在Gemini应用、NotebookLM、Google Ads、Workspace(包括Slides和Vids)、Google AI Studio、Vertex AI及Antigravity中上线。免费用户将获得有限使用额度,高级订阅用户可获得更高配额;Gemini应用中的AI Mode及Flow影视工具也将同步支持Nano Banana Pro。
值得一提的是,所有通过谷歌工具生成的图像均嵌入SynthID数字水印。Gemini应用现支持上传图像并查询其是否由谷歌AI生成。免费用户与Google AI Pro订阅用户生成的图像将保留可见水印,而Google AI Ultra订阅用户及Google AI Studio的开发者可获得无可见水印版本。谷歌表示,SynthID未来将扩展至音频与视频内容。





