【GOOGLE】Gemini API 工具链升级要点

Google 为 Gemini 3 系列 API 引入多项工具链改进:在单次请求中混合内置工具与自定义函数、在工具调用间循环传递上下文并为每次工具调用分配唯一 ID,同时将 Google Maps Grounding 扩展到 Gemini 3 家族,简化多步 agent 化工作流并提升可调试性与位置感知能力。

要点概览

  • 单次请求可同时包含内置工具与自定义函数
  • 之前需要手动在何时调用 Search/Maps 与何时调用自定义函数之间编排。现在可在同一次交互里同时传入两类工具,减少端到端延迟并简化 agent 架构。

  • 内置工具之间支持上下文循环(Context circulation)

  • 模型会在上下文中保留每次工具调用及其响应,后续步骤可访问并基于这些数据推理,例如把实时天气结果传给自定义预订工具。

  • 工具调用引入唯一响应 ID

  • 每次工具调用都带有唯一的 id,便于异步或并行调用时将模型发起的具体请求与客户端响应精确匹配,提升可调试性。

  • 为 Gemini 3 家族扩展 Maps Grounding

  • 可将 Google Maps 作为工具启用,获取空间数据、本地商户信息、通勤时长与地点详情,使模型产出更具位置感知能力。

  • 推荐使用 Interactions API

  • 虽然 generateContent API 也支持这些功能,但 Google 建议用 Interactions API 以利用其服务器端状态管理与统一的推理轨迹,便于构建复杂 agent 化流程。

适用场景与影响

  • 适合需要结合公共搜索/地图数据与内部后端逻辑的多步骤智能代理(如行程规划、带实时信息的自动化预订、混合检索与事务执行场景)。
  • 减少开发者在工具编排上的工作量、降低延迟并提升并行调用场景下的可靠性与可追踪性。

实用建议

  • 在并行或异步工具调用中记录并使用返回的工具调用 ID 以便排查。
  • 将 Maps Grounding 与内部库存/业务 API 结合,以提高位置敏感型响应的准确性。
  • 优先评估 Interactions API 来管理跨回合状态与统一调试信息。

这次更新把多工具混合、跨工具上下文流转和 Maps 定位能力整合进单次请求,进一步降低构建复杂 agent 的工程成本。

原文链接

Leave a Comment