【ANTHROPIC】Claude Managed Agents 新功能概览

Anthropic 在 Claude Managed Agents 中推出 dreaming(研究预览)、以及已公测的 outcomes、多代理编排和 webhook 功能,以增强代理的长期记忆、自我改进和复杂任务并行处理能力。Dreaming 定期回顾会话与记忆提取模式优化记忆结构,outcomes 通过独立评分器让代理按规范自检并迭代,multiagent 编排则由主代理分配子代理并行完成专责任务,适用于长流程与大规模分析场景。

概览

  • 发布时间:2026-05-06,来自 Claude Blog。
  • 重点功能:dreaming(研究预览)、outcomes(公测)、多代理编排(公测)、webhooks 支持。

Dreaming(记忆“做梦”)

  • 作用:定期审查会话与记忆库,抽取模式并整理高信号记忆,帮助代理在会话间自我改进。
  • 控制方式:可设为自动更新记忆或人工审核后落地。
  • 适用场景:长期运行任务、多代理系统中提炼跨代理共性与常见错误。

Outcomes(目标与评分器)

  • 作用:开发者用 rubric 定义“成功标准”,独立的 grader 在单独上下文中评估输出,指出不足并触发代理重试直至合格。
  • 优点:提高细节覆盖和主观质量一致性(如品牌语调、设计规范)。
  • 内部测试:相比普通提示循环,任务成功率最多提升约 10 个百分点;docx +8.4%,pptx +10.1%。
  • 集成:支持在定义 outcome 后以 webhook 通知完成状态。

Multiagent 编排(多代理协作)

  • 工作流:主代理将任务拆分,分配给具有各自模型、提示和工具的子代理并行处理,使用共享文件系统汇总结果。
  • 可追踪性:Claude Console 提供每一步的责任、顺序与原因记录,事件持久化,代理间可随时回检。
  • 适用场景:当单个代理无法高质量完成大量或并行子任务时,例如大规模日志分析或跨项目调查。

真实案例与效果

  • Harvey:通过 dreaming 记住会话间的工具与文件类型技巧,完成率测试提升约 6 倍。
  • Netflix:用多代理并行分析大量构建日志,聚焦跨系统的重复问题。
  • Spiral by Every:主代理在 Haiku 上接收请求,子代理在 Opus 并行起草,使用 outcomes 强制写作质量并只返回合格稿件。
  • Wisedocs:用 outcomes 做文档质量检查,审查速度提升 50% 且保持团队标准对齐。

可用性与上手

  • Dreaming:研究预览(需申请访问)。
  • Outcomes、多代理编排、Memory:公开公测,作为 Managed Agents 功能提供。
  • 资源:查看文档或在 Claude Console 部署首个代理。

这些功能把代理从单次回应工具升级为能跨会话学习、自我评分并并行协作的工程能力,对企业级自动化很有吸引力。

原文链接

Leave a Comment