【GOOGLE】Cloud Next ’26:谷歌云的新基建时代

在 Cloud Next ’26 上,谷歌展示了面向“代理化”AI时代的一整套产品和基础设施升级,包括面向大规模代理部署的 Gemini Enterprise Agent Platform、用于安全防护的 AI 驱动检测解决方案与合作、以及第八代 TPU(8t 与 8i)以支持训练与低延迟推理。谷歌同时强调自用先行(customer zero),并将更多机器学习算力投资用于云客户,推动云业务快速增长。

关键要点

  • 代理化时代与 Gemini
  • Gemini Enterprise 推动企业将员工变为构建者,Q1 付费月活环比增长 40%。
  • 新推 Gemini Enterprise Agent Platform:提供构建、规模化、治理与优化代理的全栈安全连接层,定位为企业级“任务控制中心”。

  • AI 驱动的安全防护

  • 发布多项代理化威胁检测方案,将 Google 威胁情报与安全运营与 Wiz 的云与 AI 安全平台整合。
  • 推出 Wiz 的 AI Application Protection Platform(AI-APP),提供从代码到云、运行时的自主防护,支持多云与混合环境。

  • 第八代 TPU:8t 与 8i

  • TPU 8t(训练优化):支持单个 superpod 扩展到 9,600 芯片与 2PB 共享高带宽内存,算力约为上一代的 3 倍,性能/瓦比可达 2x。
  • TPU 8i(推理优化):单 pod 可连通 1,152 芯片,显著降低延迟,片上 SRAM 提升 3 倍,面向同时运行百万级代理的高吞吐低延迟场景。
  • 这些 TPU 将与 NVIDIA GPU 实例一起成为谷歌云的算力选项。

  • 谷歌自用加速产品成熟

  • 谷歌强调“customer zero”策略,把自家 Bigtable、TPU 与内部 AI 生成代码的实践作为验证与改进来源。
  • 内部已大量使用 AI 生成代码(文中提到 75% 的新代码由 AI 生成并由工程师审批),并用 AI 提升安全与开发效率。

投资与增长方向

  • 谷歌表示 2026 年对机器学习算力的投资中,约超过一半将投向云业务以服务客户与合作伙伴。
  • 自家模型经 API 处理的速率从上季度每分钟 100 亿 token 增至 160 亿 token,反映使用量快速增长。

对技术实践者的影响

  • 如果你负责大规模代理部署,需要关注 Gemini Enterprise Agent Platform 的治理、可观测性与成本控制方案。
  • 对需要低延迟高并发推理的应用(例如并行代理、实时决策系统),TPU 8i 可能提供更优的吞吐/延迟比;训练密集型工作负载可考虑 TPU 8t。
  • 安全团队应评估 AI-APP 与谷歌-Wiz 联合方案在多云/混合架构上的检测与自动化响应能力。

更多信息

  • 官方博客与后续技术细节发布将包含具体实例、定价与可用区覆盖,建议关注 Google Cloud 的详细白皮书与产品文档。

谷歌把“代理化”与专用算力、以及自用验证结合起来,目标是让大规模企业级代理变得可管理且高效。

原文链接

Leave a Comment