【GOOGLE】三个项目展示Gemma 4能力
Google 宣布 Gemma 4 下载量超过 1.5 亿,并展示三位开发者如何用该模型构建低延迟离线应用、视觉交互角色化问答和将现实世界游戏化的长上下文应用;模型通过 MTP、12B 统一模型与 QAT/checkpoint 等优化,并以 Apache 2.0 许可发布,方便在边缘设备和本地部署与微调。Gemma 4 的原生音频输入、4-bit 量化支持与 256K 大上下文窗口,推动了离线语音教学、多模态识别和持久记忆类创新。
Google 宣布 Gemma 4 下载量超过 1.5 亿,并展示三位开发者如何用该模型构建低延迟离线应用、视觉交互角色化问答和将现实世界游戏化的长上下文应用;模型通过 MTP、12B 统一模型与 QAT/checkpoint 等优化,并以 Apache 2.0 许可发布,方便在边缘设备和本地部署与微调。Gemma 4 的原生音频输入、4-bit 量化支持与 256K 大上下文窗口,推动了离线语音教学、多模态识别和持久记忆类创新。
Google 发布了 Co-Scientist,一套由多个专门代理组成的协作式 AI 系统,分为生成、辩论与演化三阶段以支持结构化科学思维;监督代理负责将高层研究目标分解并并行调度任务。该系统已与全球科研团队合作,应用于感染病分子开关、肝病机制、ALS 工具整合和逆转细胞衰老等问题,并将通过 Hypothesis Generation 工具向研究者开放试验使用。
Nextdoor 工程团队借助 OpenAI 的 Codex(搭配 GPT‑5.4/5.5 与 Fast Mode)将工程师从低层实现细节中解放出来,能由单人跨平台端到端实现产品功能并快速定位难复现的系统问题,从而把瓶颈从实现移到产品战略与优先级决策上。
Google Fi 在 Unlimited Premium 计划中加入多项出境体验改进:Pixel 手机上实现多运营商自动切换、在 22 个新增国家支持 5G、扩大内置 VPN 与 Wi‑Fi 自动连接覆盖,并能主动排查并修复连接问题。新用户在 2026‑06‑30 前订阅可享首期 5 折优惠。
Google 首席学习与可持续发展技术官 Ben Gomes 在东京大学与师生对话,探讨 AI 如何增强学习体验而非取代教师,强调好奇心、教师角色与个性化辅导的重要性,并介绍 Google 在 LearnLM、Gemini 等模型上的相关工作与与东京大学的联合研究。AI 应作为放大好奇心和减小数字鸿沟的工具,同时让教师将更多时间用于人际互动与引导。
Google 推出 Gemini 3.5 Live Translate,作为新一代音频模型实现超过 70 种语言的近实时语音到语音翻译,生成保留说话人语调、节奏和音高的自然语音并尽量减少停顿。该功能已通过 Gemini Live API 与 Google AI Studio 开放开发者公测,Google Meet 企业私测以及 Android/iOS 的 Google Translate 推出。
谷歌艺术与文化与旧金山Exploratorium合作推出“See in CMYK”,用Gemini AI将用户照片转化为由青、品、黄、黑四色图标构成的互动艺术,既可在线体验也有实体展览;项目通过语义分析替换传统印刷点为与图片语义相关的小图标,帮助以互动方式理解色彩叠加与印刷原理。Summaries由Google AI生成,生成式AI仍属实验性。
帕丽斯·希尔顿受邀成为 Android 首位“icon in residence”,在谷歌 Sliv Lab 使用 Gemini 与 Canvas 无代码工具快速搭建了粉色风格的生产力应用 Iconic Ideas,并带领青少年参与 Android 创新挑战,展示非工程背景的人也能创造技术产品。该项目强调把创意作为出发点,降低想法到实现的门槛,推动更多创作者参与技术构建。
Google 与 American Airlines 签署了迄今公开宣布的最大一笔航空可持续燃料(SAF)企业-航空公司协议,支持解锁3500万加仑 SAF,预计可减少近30万吨二氧化碳当量。该多年度采购信号帮助美航与燃料生产商 Valero 达成长期供给协议,旨在通过拉动需求促进 SAF 规模化生产与采纳。
Google DeepMind 启动为期三个月的加速器,选拔15家欧洲早期机器人创业公司,提供技术导师、产品指导及对接 Google 的 AI 与机器人模型,帮助把研究成果落地为可用的物理 AI 解决方案。孵化公司涵盖医疗、制造、物流、气候等领域,目标是将先进的语言、视觉与行动模型应用到真实世界的机器人系统中。