Anthropic收购计算机视觉与交互初创公司Vercept,旨在提升Claude在真实应用内的“电脑使用”能力,从而让模型能在多步骤任务中像人类操作员一样感知与交互。此次并购将把Vercept团队与技术整合进Anthropic,以推进包括Sonnet 4.6在内的模型在表格、跨标签页表单等复杂任务上的表现。
背景与目标
– Anthropic强调用户正在用Claude执行越来越复杂的任务,如跨代码仓库编写运行代码、整合海量研究与跨工具工作流管理。
– “电脑使用”(computer use)指Claude在真实应用内进行多步操作,结合感知与交互能力来完成复杂任务。
关于Vercept与并购理由
– Vercept专注于让AI在常用软件中同时“看”和“动”,解决感知与交互的难题。
– 核心团队包括联合创始人Kiana Ehsani、Luca Weihs与Ross Girshick,其专长与Anthropic现有挑战直接契合。
– Vercept将停止对外产品并并入Anthropic,贡献技术与人才以推动电脑使用前沿。
技术进展与影响
– 近期发布的Claude Sonnet 4.6在OSWorld评测上表现显著提升:从2024年底的低于15%提升到当前72.5%。
– Sonnet 4.6在导航复杂电子表格与跨浏览器标签页完成表单等任务上已接近人类水平。
– 并购有望进一步增强模型的视觉感知、界面交互与多步骤决策能力,提升在真实应用场景中的可靠性与效率。
组织与招聘
– Vercept是Anthropic继收购Bun之后的又一次策略性团队整合。
– Anthropic对外表示持续寻找与其安全与严谨理念匹配的团队和个人,鼓励有兴趣者查看其招聘页面。
此举显示Anthropic正把增强现实应用内交互作为实现更实用AI的关键路径。