【ANTHROPIC】构建可进化的Claude智能代理

本文提出三大模式,帮助开发者在延迟与成本约束下构建能跟随Claude能力演进的应用:用好Claude已掌握的工具、定期思考可停止的工作,以及在代理束缚中谨慎设定边界。这些方法通过让模型更多地自行编排、管理上下文与持久化信息,减少不必要的token开销并提高长期任务表现。

概览

  • 目标:平衡智能、延迟与成本,构建能随Claude能力演进的代理应用。
  • 三大模式:用它已知道的东西、问“我可以停止做什么?”,以及谨慎设定代理边界。

1) 用Claude已经掌握的工具

  • 原则:优先使用Claude擅长且经常练习的简单通用工具(例如bash和文本编辑器)。
  • 证据:Claude在SWE-bench等基准上随版本提升表现,很多高级功能(技能、程序化调用、记忆)都是由这些通用工具组合而成。

2) 反复问“我能停止做什么?”

  • 不要把所有编排决策固定在外部Harness上;随着模型能力提升,某些假设会过时。
  • 让Claude负责编排:给模型能执行代码的工具(bash、REPL),让Claude决定哪些工具输出需要进入上下文或被过滤,从而降低token与延迟成本。
  • 让Claude管理上下文:用技能(YAML简述+按需读取)实现渐进披露,或用上下文编辑和子代理隔离冗余/陈旧信息。
  • 让Claude自行持久化:压缩(compaction)与记忆文件夹让模型自己选择何时记忆与读取,实现长期任务连续性,多个版本在BrowseComp等任务上显示了明显提升。

3) 小心设定代理束缚(harness)

  • Harness应避免过度预先硬编码决策或将所有工具结果都回灌到上下文。
  • 设计原则:把通用的、可由代码表达的编排权下放给模型;把任务特定但不常用的信息以按需方式提供给模型。

实践要点

  • 优先用Claude熟练的少量工具构建能力基座。
  • 用可执行代码工具把编排权交给模型,减少不必要的token流量。
  • 使用技能与按需读取策略管理上下文,结合压缩与记忆文件夹支持长时任务。
  • 定期检验代理假设,随着模型升级调整harness策略。

结论

  • 随着Claude变得更强,开发者应把更多决策权交给模型,同时通过合理的工具设计与上下文管理来控制成本与延迟,从而构建更稳健、可进化的代理应用。

把编排和记忆权交给模型是高效构建代理的关键,但也需谨慎设计工具与边界以防失控或资源浪费。

原文链接

Leave a Comment