【GOOGLE】Nano Banana 2：高保真图像生成与编辑

Google 推出 Nano Banana 2（也称 Gemini 3.1 Flash Image），在图像生成与高级编辑上带来更高保真度、更快速度与更强的世界知识与文本本地化能力，适用于规模化视觉生成与多语言广告本地化等场景。开发者可通过 Google AI Studio 或 Gemini API（需付费 API key）立即使用并结合新分辨率、更多原生长宽比与可配置推理级别实现生产级部署。

简介
– Nano Banana 2 = Gemini 3.1 Flash Image，定位为高性价比、可生产化的图像生成与编辑模型。

关键能力
– 提升世界知识：可结合网络图像搜索进行视觉“落地”，生成更贴近真实参考的画面（示例：Window Seat）。
– 先进文本渲染与本地化：提高画中文本清晰度与准确性，支持在图像内直接生成/翻译多语言文本（示例：Global Ad Localizer）。
– 更强的创作控制与一致性：更丰富的光照、纹理与细节；改进的指令遵循能力，保真执行复杂多层提示。

新功能与性能选项
– 原生长宽比扩展：新增 4:1、1:4、8:1、1:8 等多种比率支持，兼容现有比率。
– 新分辨率 512px：介于 1K/2K/4K 之间的低延迟、高效选项，适合快速迭代和高吞吐流水线。
– 可配置“思考”级别：Minimal（默认）、High、Dynamic，可根据复杂提示选择更充分的内部推理以提升输出质量。

生产就绪与集成
– 已有合作方将模型集成到生产流程以扩展视觉功能。
– 要求：通过付费 API key 在 Google AI Studio 使用 Gemini API 调用 Nano Banana 2。

开发者建议
– 利用512px做快速原型与迭代，遇到细节要求再切换到更高分辨率。
– 在多语言广告或 UI 生成场景测试内嵌文本本地化功能，评估可读性与布局兼容性。

这是面向生产环境的明显升级，尤其在文本本地化与 web 驱动视觉参考方面对开发者很有吸引力。

原文链接

Leave a Comment Cancel reply