【ANTHROPIC】Anthropic 发布责任性扩展政策 3.0

Anthropic 发布了第三版《责任性扩展政策》（RSP v3.0），回顾过去两年实践并对政策进行强化与透明度提升的调整。新版在保留按能力触发（if-then）承诺框架的同时，改进了评估、应对生物与其他高风险能力的不确定性，并强调行业合作与政府参与来应对难以单厂应对的风险。

背景与目标

RSP 的作用机制（希望达成的变化）

过去两年评估：成功之处

刺激内部安全防护改进：为满足 ASL-3，Anthropic 开发并改进了输入/输出分类器等防护手段，并于 2025 年 5 月启动 ASL-3 防护。
促成行业跟进：OpenAI 与 Google DeepMind 在数月内采纳了类似框架，一些公司也部署了生物武器相关分类器。
影响政策与透明度要求：RSP 原则帮助塑造早期监管与合规框架（如加州 SB 53、纽约 RAISE 草案与欧盟 AI 法案的行为准则），并促使 Anthropic 发布 Frontier Compliance Framework 等文档。

不足与挑战

RSP v3.0 的重点改进（高层概览）

结论

Anthropic 认为 RSP 在推动公司内部改进与促进行业内最低规范方面有效，但在将阈值作为多方共识触发点以及在评估科学上仍需更多工作。RSP v3.0 旨在通过更大透明度、改进评估与强调协作来弥补这些不足。

这是一次务实的迭代：Anthropic 在承认评估不确定性的同时，加强透明与协同，是产业治理走向成熟的必要步骤。