【GOOGLE】Nano Banana 2:高保真图像生成与编辑

Google 推出 Nano Banana 2(也称 Gemini 3.1 Flash Image),在图像生成与高级编辑上带来更高保真度、更快速度与更强的世界知识与文本本地化能力,适用于规模化视觉生成与多语言广告本地化等场景。开发者可通过 Google AI Studio 或 Gemini API(需付费 API key)立即使用并结合新分辨率、更多原生长宽比与可配置推理级别实现生产级部署。

简介
– Nano Banana 2 = Gemini 3.1 Flash Image,定位为高性价比、可生产化的图像生成与编辑模型。

关键能力
– 提升世界知识:可结合网络图像搜索进行视觉“落地”,生成更贴近真实参考的画面(示例:Window Seat)。
– 先进文本渲染与本地化:提高画中文本清晰度与准确性,支持在图像内直接生成/翻译多语言文本(示例:Global Ad Localizer)。
– 更强的创作控制与一致性:更丰富的光照、纹理与细节;改进的指令遵循能力,保真执行复杂多层提示。

新功能与性能选项
– 原生长宽比扩展:新增 4:1、1:4、8:1、1:8 等多种比率支持,兼容现有比率。
– 新分辨率 512px:介于 1K/2K/4K 之间的低延迟、高效选项,适合快速迭代和高吞吐流水线。
– 可配置“思考”级别:Minimal(默认)、High、Dynamic,可根据复杂提示选择更充分的内部推理以提升输出质量。

生产就绪与集成
– 已有合作方将模型集成到生产流程以扩展视觉功能。
– 要求:通过付费 API key 在 Google AI Studio 使用 Gemini API 调用 Nano Banana 2。

开发者建议
– 利用512px做快速原型与迭代,遇到细节要求再切换到更高分辨率。
– 在多语言广告或 UI 生成场景测试内嵌文本本地化功能,评估可读性与布局兼容性。

这是面向生产环境的明显升级,尤其在文本本地化与 web 驱动视觉参考方面对开发者很有吸引力。

原文链接

Leave a Comment