OpenAI 将 ChatGPT 的默认模型升级为 GPT‑5.5 Instant,重点提升事实性、减少幻觉并改进上下文利用与个性化控制,使日常交互更准确、简洁且更契合用户需求。内部评估显示在高风险领域幻觉减少显著,模型在图像分析、理工问题与检索决策上也有进步。
更新要点:
– 核心目标:把 ChatGPT 的默认模型(Instant)变得更聪明、更准确、回答更清晰且更个性化。
– 事实性与错误率:在内部评估里,GPT‑5.5 Instant 在医学、法律、金融等高风险提示上的虚构声明比 GPT‑5.3 Instant 减少约 52.5%,在用户标注的难题对话中不准确信息减少约 37.3%。
– 能力提升:模型在处理图片/照片上传、回答 STEM 问题、以及何时调用网络检索以给出更有用答案方面更强。
– 风格与交互:回答更紧凑、口吻更自然,减少不必要的追问与冗余格式(如过度表情或长格式),保持实用性与可读性。
– 可控个性化:增强对已共享上下文的利用,并提供更多个性化控制,便于在保持准确性的同时更贴合用户需求。
– 可用性:GPT‑5.5 Instant 已作为 ChatGPT 的默认 Instant 版本推出,面向日常大量用户,目标是以小幅改进带来广泛体验提升。
示例与说明:
– 在数学和推理示例中,模型展示了更强的纠错与复核能力:能识别并修正早期推导中的错误,避免把不满足原式的次优解当成最终结论。
– 在沟通建议类用例中,回答更注重实用性,给出多种风格的措辞示例并指出不建议的做法。
注意事项:
– 报告基于 OpenAI 内部评估数据,未详列对外基准测试细节或对比样本;实际表现仍取决于具体任务与提示设计。
这次以事实性和检索决策为主的优化,更贴近日常专业使用场景,但仍需外部基准验证。