【OPENAI】NVIDIA 用 Codex 提速工程与研究

NVIDIA 工程与研究团队将 Codex（基于 GPT‑5.5）作为默认开发与研究代理，用于构建生产系统、自动化端到端机器学习实验并提升开发效率。团队报告在实验流程和代码重写等场景中显著提速与质量改进，同时借助更长会话和更高自治性发现代码缺陷与设计空白。

概览
– Codex 基于 GPT‑5.5，在 NVIDIA GB200/GB300 基础设施上运行，已在公司内广泛部署（约 4 万名员工可用）。

生产系统构建
– 工程编码代理团队将 Codex 作为处理复杂工程任务的首选工具，能维持长会话并自主选择工具与技能。
– 实例：将内部平台从 MVP 发展为可投产系统，提升可扩展性与可靠性；几小时内实现并测试类似 Riverside 的播客录制应用，且过程自动化完成测试。
– 开发者反馈：Codex 更能发现程序中的 bug 和设计空白，减少人工干预。

端到端研究工作流
– Codex 自动化研究循环：从识别研究方向、提取文献线索、构建知识图，到生成实验脚本并在远程机器上运行。
– 支持 SSH 与远程执行，研究人员可在本地发起并管理大规模训练任务，免去繁琐的主机设置。
– 性能改写：将旧 Python 代码库翻译为 Rust 等更高效实现，出现显著性能提升（受访者提到达 ~20x）。

成效与展望
– 团队量化效果：端到端研究流程速度约提升 10 倍；Codex 在创造性与证据追踪方面表现优于竞品。
– 团队认为只是初步探索，未来将继续将更多真实系统的构建与测试交给 Codex。

注意事项
– 报道基于内部反馈与案例，未提供独立基准或安全/隐私细节。

Codex 在工程与研究场景展示了显著的生产力提升，但公开细节还不足以评估泛化与安全风险。

原文链接

Leave a Comment Cancel reply