【OPENAI】OpenAI 收购 Promptfoo 强化安全评估
OpenAI 将收购 AI 安全平台 Promptfoo,并把其功能整合进企业级平台 OpenAI Frontier,以便在开发阶段系统化检测与修复代理和 LLM 应用的安全与合规风险。Promptfoo 团队将继续维护开源项目,同时推进在 Frontier 中的原生安全测试、开发流程整合与审计可追溯能力。
OpenAI 将收购 AI 安全平台 Promptfoo,并把其功能整合进企业级平台 OpenAI Frontier,以便在开发阶段系统化检测与修复代理和 LLM 应用的安全与合规风险。Promptfoo 团队将继续维护开源项目,同时推进在 Frontier 中的原生安全测试、开发流程整合与审计可追溯能力。
SpeciesNet 是 Google 开源的物种识别 AI 模型,能自动从陷阱相机照片中识别近 2,500 种哺乳类、鸟类和爬行动物,显著加速生态监测和研究。自开源一年以来,全球多项项目(如坦桑尼亚的 Snapshot Serengeti、哥伦比亚的 Humboldt Institute、澳大利亚的 Wildlife Observatory 及美国爱达荷等)已将其用于处理海量影像并辅助保护濒危物种与分析栖息地变化。
Descript 利用 OpenAI 的更强推理能力,将翻译流程从“语义优先、时长修正”改为在生成阶段同时优化语义与时长,从而显著提升配音自然度与规模化效率。上线首月配音导出增长 15%,不同语言的时长符合率提升 13–43 个百分点,语义保真度亦维持在较高水平。
OpenAI 推出 Codex Security 研究预览版,这是一个面向开发者和安全工程师的 AI 应用安全代理,能基于项目上下文检测、验证并建议修复复杂漏洞,目标是提高置信度并降低误报噪音。该工具侧重于理解代码和项目脉络以生成更相关的安全诊断和补丁建议,目前以研究预览形式对外开放以收集反馈。
巴利亚斯尼资产管理建立了集中化的Applied AI团队,基于GPT‑5.4与内部模型、严格评估流水线和代理化工作流,构建能像分析师推理和执行的AI投研系统,广泛部署于近95%的投资团队,显著提升研究速度、质量与合规可控性。该系统强调模型严格评测、用户—AI深度协同、实时反馈回路与中央化平台兼顾本地定制。
文章提出五种AI价值模型:员工赋能、AI原生分发、专家能力扩展、系统与依赖管理(Codex)以及流程重构(Agents),说明企业应按序构建基础能力以实现可复用、可治理的规模化价值;每种模型有不同的经济属性、度量指标和常见失败模式。作者主张将AI视为价值模型组合而非孤立试点,通过循序渐进的部署累积长期竞争优势。
OpenAI 推出 ChatGPT for Excel 测试版,將 GPT‑5.4 直接嵌入 Excel,協助建模、情景分析與錯誤追蹤;同時在 ChatGPT 中新增多家金融數據供應商整合,方便在受管控環境下做研究與估值分析。這些功能強調可追溯性、團隊一致性與企業級安全與治理控管。
谷歌通过将Gemini多模态模型与Lens的视觉检索结合,在Search的AI Mode中实现了对单张图像内多个目标的并行识别与检索。系统先进行多目标推理,然后用“fan-out”并发触发多次检索,整合结果后以一条连贯响应呈现给用户。
OpenAI 发布了 GPT‑5.4 Thinking 的系统卡,说明了该型号在 GPT‑5 系列中的定位、与先前版本的安全防护延续性,以及首次在通用模型中实现面向高能力网络安全(cybersecurity)的缓解措施;文档将 GPT‑5.4 Thinking 与 GPT‑5.2 Thinking 做为基线对比,并承认其在网络安全防护上建立于 GPT‑5.3 Codex 的方法之上。系统卡提供了链接与关联资源,便于开发者和研究者查阅详细安全与产品说明。
OpenAI 发布 GPT‑5.4 与 GPT‑5.4 Pro,作为面向专业工作的最强和最高效的边界模型,改进了推理、代码能力、工具与计算机使用,并支持高达 100 万 token 的上下文,能更准确高效地完成复杂任务。该模型在表格、演示文稿和文档处理、深网检索与可解释思路规划上显著提升,同时降低了幻觉率并提高了令牌效率。