【GOOGLE】I/O 2026:面向行动的Agent时代

Google 在 I/O 2026 发布多项面向“agent”与多模态应用的进展,重点包括两款新模型 Gemini Omni 与 Gemini 3.5、提升到代理优先的 Antigravity 平台、以及将智能 agent 扩展到搜索、购物、Gemini 应用与多种产品形态中。大会还推出 Universal Cart、智能眼镜、新的开发者工具(Google AI Studio、增强的 Gemini API)和面向科学、创作与企业的产品化更新。

核心宣布

  • 新模型:
  • Gemini Omni:支持从任意输入(包括视频)生成与自然语言编辑,强调世界理解和多模态编辑能力。
  • Gemini 3.5(Flash):主打前沿智能与“action”,用于执行复杂的 agentic 工作流。

  • Agent 平台与产品化:

  • Google Antigravity:定位为 agent-first 的开发平台,推动从“写作工具”向“可执行 agent”转变,让更多人能构建 agent 体验。
  • Agent 能力落地:Information agents(搜索)、Gemini Spark、Daily Brief(Gemini 应用)、以及 Universal Cart(智能购物车)等跨产品部署。

  • 产品与形态扩展:

  • Search:将搜索引擎与 AI 能力更紧密整合,推动更 agent 化的查询与交互。
  • Gemini App:变得更主动、全天候提供帮助与执行任务。
  • 智能眼镜:计划于今年秋季发布,支持方向指引、发送消息、拍照等无手机操作功能。
  • Google Pics、Ask YouTube 等也在嵌入 Gemini 能力,扩展到新终端与体验。

  • 开发者與工具:

  • Google AI Studio:新增原生 Android 支持、Workspace 集成与移动端编辑体验。
  • 增强的 Gemini API 与 Antigravity 更新,帮助开发者构建 agent 应用与工作流。

  • 可信度與安全:

  • 内容来源识别:扩展 SynthID 与 C2PA 内容凭据,以便识别 AI 生成或被编辑的媒体。

  • 商业与订阅:

  • Google One / AI 订阅更新:推出 100 美元的 AI Ultra 套餐,并调整 AI Plus、Pro、Ultra 的功能与权益。

面向从业者的要点

  • 如果你做多模态产品或 agent 平台,应优先评估 Gemini Omni 的输入/编辑能力与 Gemini 3.5 的执行接口。
  • 利用 Antigravity 与增强的 Gemini API 可以更快把 agent 能力落到搜索、购物或企业应用中;Google AI Studio 的 Android 原生支持降低移动端集成门槛。
  • 注意新的内容可溯源工具(SynthID/C2PA)在合规与内容标注中的应用,纳入模型输出与产品流程设计。

I/O 2026 明显把重点从“大模型能力”转向“agent 可执行性”和产品级落地,生态门槛正在被进一步降低。

原文链接

Leave a Comment