【OPENAI】乐天用Codex将修复速度翻倍

乐天将OpenAI的Codex深度整合到工程流程中,在监控诊断、CI/CD自动化审查和全栈交付上带来显著效益;公司报告平均恢复时间(MTTR)约减少50%,并能把季度级项目压缩到数周完成。团队把重点放在更快、更安全、更自主的交付上,通过规范化输入与验证把工程师从逐行审查中解放出来。

【OPENAI】为代理设计抗 prompt 注入策略

OpenAI 介绍了针对 prompt 注入与社工攻击的防护思路:不仅检测恶意输入,还通过约束代理能力、限制敏感信息流出与在关键动作上要求确认来减轻攻击影响。该方法把 AI 视为在对抗性环境中的代理,结合源-汇分析、行为限制与交互式确认(如 Safe Url)以保护用户安全。

【OPENAI】为 Responses API 提供计算环境

OpenAI 在 Responses API 之上构建了一个托管计算环境,结合 shell 工具与容器工作区,使模型能以受控方式执行命令、读写文件、访问网络和并行任务,从而将模型升级为能处理真实世界复杂工作流的代理。该系统还提供输出截断、并发会话、与内建的上下文压缩(compaction)以支持长期、多步骤和状态化流程,降低开发者自行搭建执行环境的复杂度与安全风险。

【OPENAI】Wayfair 用 OpenAI 提升目录与客服效率

Wayfair 将 OpenAI 模型嵌入核心运营,自动化供应商工单分流与产品属性校验,在百万级商品上修正了数百万标签并提升展示与点击表现;同时通过分阶段信任机制把 AI 从辅助逐步推进到半自动化,大幅提升处理量与响应速度。系统结合定义代理、产品数据和人工抽查以保证质量并与供应商协作确认高风险更改。

【OPENAI】改进前沿大模型的指令层级

OpenAI 提出 IH-Challenge,通过强化学习训练模型在多源指令冲突中按信任级别优先执行(System > Developer > User > Tool),从而提升安全约束遵循、抗提示注入能力和安全可控性。训练后的 GPT-5 Mini-R 在多项学术与内部基准上显著提升指令层级鲁棒性,同时未出现明显能力退化或过度拒绝的副作用。

【OPENAI】ChatGPT 的交互式数学与科学可视化

OpenAI 在 ChatGPT 中推出互动可视化讲解,起始覆盖 70 多个核心数学与科学概念,用户可实时调整变量、操作公式并观察图形变化,从而增强概念理解和探索性学习;该功能即日起在全球所有付费与免费方案上线。ChatGPT 围绕常见题目(如毕达哥拉斯定理、理想气体定律、圆的面积等)提供可交互模块,帮助学生和自学者把抽象公式变成可实验的演示。

【GOOGLE】Gemini 在 Sheets 达到最新水准

Google 宣布 Gemini in Sheets 在公开基准 SpreadsheetBench 上取得 70.48% 的成功率,达到处理真实复杂表格编辑任务的最新水平,接近人类专家表现。该功能作为 Google Workspace 测试版推出,可用于生成、组织和编辑整张表格,覆盖从基础操作到复杂数据分析的场景。

【GOOGLE】开源物种识别模型助力野生动保

SpeciesNet 是 Google 开源的物种识别 AI 模型,能自动从陷阱相机照片中识别近 2,500 种哺乳类、鸟类和爬行动物,显著加速生态监测和研究。自开源一年以来,全球多项项目(如坦桑尼亚的 Snapshot Serengeti、哥伦比亚的 Humboldt Institute、澳大利亚的 Wildlife Observatory 及美国爱达荷等)已将其用于处理海量影像并辅助保护濒危物种与分析栖息地变化。