【OPENAI】ChatGPT Images 2.0 重磅更新

OpenAI 发布 ChatGPT Images 2.0,带来更先进的图像生成能力,包括显著改进的文本渲染、多语言支持与更强的视觉推理。该模型旨在提升生成图像中的文字质量、理解复杂视觉场景并支持更多语言输入与输出。此更新主要面向需要高保真图像和跨语言能力的 AI/技术从业者。

【GOOGLE】企业级AI代理正在落地

谷歌云与十家行业领军企业合作,将自主代理(AI agents)部署到生产场景,覆盖游戏测试、客户服务、财富管理与零售等领域;这些案例展示了代理如何替代重复任务、提升规模与效率,并释放员工用于更高价值工作。文章以真实客户为样板,提供在企业内识别和扩展代理化工作的路线图。

【OPENAI】ChatGPT 推出 Workspace Agents

OpenAI 在 ChatGPT 中推出 Workspace Agents:基于 Codex 的自动化代理,能在云端执行复杂工作流、跨工具协作并为团队提供可扩展的自动化能力,同时强调安全与权限控制。该功能面向需要将常规任务编排为可靠、可重复流程的工程与产品团队。

【GOOGLE】1302个生成式AI真实案例速览

Google汇总并更新了来自全球组织的1,302个生成式AI落地案例,展示从助理向自治代理团队、将自然语言桥接遗留系统、生成式媒体批量化、多模态感知物理世界到网络安全自动化修复等五大趋势。文中还说明这些落地多基于Gemini Enterprise、Gemini CLI与AI Hypercomputer等Google Cloud工具,并通过模型分析提炼出十条洞见。

【GOOGLE】Gemini Embedding 2 正式可用

Google 宣布 Gemini Embedding 2 正式通过 Gemini API 和 Vertex AI 对外提供,预览期内已被用于电商检索与视频分析等多模态原型。该向量嵌入以原生多模态能力为特色,旨在简化跨文本、图像、视频和音频的检索与推理管道,提升从原型到生产的稳定性与优化。

【OPENAI】用 WebSocket 加速代理式工作流

文章介绍 OpenAI 在 Responses API 的 Codex agent 循环中,如何通过引入 WebSocket 以及基于连接的缓存来减少每次请求的开销并改善模型响应延迟;实验显示这些改进在多轮代理式任务中显著提升性能。结论强调在长连接和本地缓存中保留上下文与资源可以显著降低网络与计算成本。