【GOOGLE】Cloud Next ’26：谷歌云的新基建时代

在 Cloud Next ’26 上，谷歌展示了面向“代理化”AI时代的一整套产品和基础设施升级，包括面向大规模代理部署的 Gemini Enterprise Agent Platform、用于安全防护的 AI 驱动检测解决方案与合作、以及第八代 TPU（8t 与 8i）以支持训练与低延迟推理。谷歌同时强调自用先行（customer zero），并将更多机器学习算力投资用于云客户，推动云业务快速增长。

关键要点

代理化时代与 Gemini
Gemini Enterprise 推动企业将员工变为构建者，Q1 付费月活环比增长 40%。
新推 Gemini Enterprise Agent Platform：提供构建、规模化、治理与优化代理的全栈安全连接层，定位为企业级“任务控制中心”。
AI 驱动的安全防护
发布多项代理化威胁检测方案，将 Google 威胁情报与安全运营与 Wiz 的云与 AI 安全平台整合。
推出 Wiz 的 AI Application Protection Platform（AI-APP），提供从代码到云、运行时的自主防护，支持多云与混合环境。
第八代 TPU：8t 与 8i
TPU 8t（训练优化）：支持单个 superpod 扩展到 9,600 芯片与 2PB 共享高带宽内存，算力约为上一代的 3 倍，性能/瓦比可达 2x。
TPU 8i（推理优化）：单 pod 可连通 1,152 芯片，显著降低延迟，片上 SRAM 提升 3 倍，面向同时运行百万级代理的高吞吐低延迟场景。
这些 TPU 将与 NVIDIA GPU 实例一起成为谷歌云的算力选项。
谷歌自用加速产品成熟
谷歌强调“customer zero”策略，把自家 Bigtable、TPU 与内部 AI 生成代码的实践作为验证与改进来源。
内部已大量使用 AI 生成代码（文中提到 75% 的新代码由 AI 生成并由工程师审批），并用 AI 提升安全与开发效率。

投资与增长方向

谷歌表示 2026 年对机器学习算力的投资中，约超过一半将投向云业务以服务客户与合作伙伴。
自家模型经 API 处理的速率从上季度每分钟 100 亿 token 增至 160 亿 token，反映使用量快速增长。

对技术实践者的影响

如果你负责大规模代理部署，需要关注 Gemini Enterprise Agent Platform 的治理、可观测性与成本控制方案。
对需要低延迟高并发推理的应用（例如并行代理、实时决策系统），TPU 8i 可能提供更优的吞吐/延迟比；训练密集型工作负载可考虑 TPU 8t。
安全团队应评估 AI-APP 与谷歌-Wiz 联合方案在多云/混合架构上的检测与自动化响应能力。

更多信息

官方博客与后续技术细节发布将包含具体实例、定价与可用区覆盖，建议关注 Google Cloud 的详细白皮书与产品文档。

谷歌把“代理化”与专用算力、以及自用验证结合起来，目标是让大规模企业级代理变得可管理且高效。

原文链接

Leave a Comment Cancel reply