【OPENAI】NVIDIA 用 Codex 提速工程与研究

NVIDIA 工程与研究团队将 Codex(基于 GPT‑5.5)作为默认开发与研究代理,用于构建生产系统、自动化端到端机器学习实验并提升开发效率。团队报告在实验流程和代码重写等场景中显著提速与质量改进,同时借助更长会话和更高自治性发现代码缺陷与设计空白。

概览
– Codex 基于 GPT‑5.5,在 NVIDIA GB200/GB300 基础设施上运行,已在公司内广泛部署(约 4 万名员工可用)。

生产系统构建
– 工程编码代理团队将 Codex 作为处理复杂工程任务的首选工具,能维持长会话并自主选择工具与技能。
– 实例:将内部平台从 MVP 发展为可投产系统,提升可扩展性与可靠性;几小时内实现并测试类似 Riverside 的播客录制应用,且过程自动化完成测试。
– 开发者反馈:Codex 更能发现程序中的 bug 和设计空白,减少人工干预。

端到端研究工作流
– Codex 自动化研究循环:从识别研究方向、提取文献线索、构建知识图,到生成实验脚本并在远程机器上运行。
– 支持 SSH 与远程执行,研究人员可在本地发起并管理大规模训练任务,免去繁琐的主机设置。
– 性能改写:将旧 Python 代码库翻译为 Rust 等更高效实现,出现显著性能提升(受访者提到达 ~20x)。

成效与展望
– 团队量化效果:端到端研究流程速度约提升 10 倍;Codex 在创造性与证据追踪方面表现优于竞品。
– 团队认为只是初步探索,未来将继续将更多真实系统的构建与测试交给 Codex。

注意事项
– 报道基于内部反馈与案例,未提供独立基准或安全/隐私细节。

Codex 在工程与研究场景展示了显著的生产力提升,但公开细节还不足以评估泛化与安全风险。

原文链接

Leave a Comment