Google 发布 Gemini Robotics-ER 1.6,作为面向机器人任务的推理优先模型升级,提升空间逻辑、多视角理解、任务规划与成功检测等关键能力,并新增仪表读数功能。该模型在对抗性空间推理上展现更佳安全合规性,开发者可通过 Gemini API 与 Google AI Studio 使用。
- 概述
-
Gemini Robotics-ER 1.6 是 Google 为物理代理(机器人)优化的推理优先模型升级,目标是让机器人更精准地理解真实世界环境。
-
主要能力提升
- 空间逻辑与多视角理解:改进对场景空间关系和从多视角整合信息的推理能力。
- 任务规划与成功检测:增强机器人制定步骤与判断任务是否完成的能力。
-
仪表读数(instrument reading):新增让机器人读取复杂仪表和视窗(sight glass)的能力,该能力通过与 Boston Dynamics 的合作发现并开发。
-
安全与合规
-
声称为迄今为止最安全的机器人模型,在对抗性空间推理任务上对安全策略的遵循性更高。
-
可用性
-
从即日起,开发者可通过 Gemini API 与 Google AI Studio 访问并试用 Gemini Robotics-ER 1.6。
-
适用场景(隐含)
- 物流与导航、工业维护与巡检(含仪表读取)、多相机感知场景等需要精细空间推理与跨视角理解的机器人应用。
这是面向工业与真实环境机器人的重要进展,尤其是仪表读数能力有助于实际运维场景。