5月Google围绕“能动(agentic)”AI发布多项产品与研究进展:推出面向创作与推理的Gemini 3.5与多模态创造平台Gemini Omni,强化主动式助手体验并在硬件、健康、量子生命科学等领域推出配套产品和合作。总体方向是把更强的推理、行动与多模态生成功能,嵌入日常工具以实现更主动、高效的工作与生活支持。
概览
– 主题:进入“能动(agentic)”时代,强调模型能推理、执行多步任务并主动提供服务。
核心产品与模型
– Gemini 3.5:面向代理与编码场景的最新模型,增强行动能力以执行复杂多步工作流。
– Gemini Omni:多模态创造平台,支持图像/音频/视频/文本等任意输入并生成高质量视频与创作内容。
助手與應用
– Gemini 应用升级:界面改进、个性化每日简报与Gemini Spark,向主动管理邮箱、日程等方向演进。
– Search 中的信息代理:引入24/7后台监控与更新功能,结合网络与AI提供可操作的情报。
多模态与仿真
– Project Genie + Street View:实验性在浏览器内模拟、探索高度逼真的交互式3D真实场景。
创作与产业合作
– Flow Music 与 Believe 合作:为音乐人和制作人提供AI创作助理,覆盖从创意到后期的流程支持。
硬件與健康
– 新硬件(如Googlebook、Fitbit Air)针对AI工具优化以提升体验。
– Google Health 应用:扩展个人健康管理,與AI功能结合提升日常健康支持。
科研与前沿
– 量子与生命科学倡议:将先进量子科学与AI应用于生命科学研究的探索性计划。
結論
– 5月的更新聚焦把强大多模态与能动能力,集成到应用、硬件和科研中,目标是让AI更主动、实用并深入日常场景。
Google正把大模型从被动问答转向主动执行与创造,但实际体验和隐私治理仍是关键考验。