【GOOGLE】Gemini 3.1 Flash TTS 发布

Google 发布了 Gemini 3.1 Flash TTS,一款更自然且可控性更强的文本转语音模型,支持 70+ 语言并在生成音频中嵌入 SynthID 水印以防止误用。开发者可通过 Gemini API、Google AI Studio 与 Vertex AI 预览使用,并通过音频标签精细控制语速、语气与表现。

【GOOGLE】Gemini API 预付费计费上线

Google 在 AI Studio 推出 Gemini API 的 Prepay 预付计费模式,允许开发者用余额方式购买 API 学分以提高支出可预测性并避免月末突增费用;目前先在美国对新云计费账户开放,全球将逐步上线。该方案可设置自动补充学分,并在建立稳定支付记录后切换回按后付费及更高配额的用量层级。

【GOOGLE】Gemini桌面App登陆macOS

Google 将 Gemini 原生应用带到 macOS(15及以上),用户可免费下载安装,通过快捷键 Option + Space 在桌面任意位置唤出 AI 助手并可共享窗口以便让模型查看本地文件与屏幕内容,支持快速生成图像和视频。首个版本侧重于桌面工作流集成,后续会逐步增强个性化与主动功能。

【GOOGLE】Dynamic Search Ads 升级为 AI Max

Google 宣布自今年九月起,将把 Dynamic Search Ads(DSA)、自动生成素材和广告系列级广泛匹配设置自动升级为 AI Max;现已结束测试阶段并且官方建议尽早自愿升级以保留控制权并熟悉新功能。AI Max 结合网站内容与实时意图信号,默认开启搜索词匹配、文本定制及最终 URL 扩展,旨在提升转化和覆盖面同时提供更精细的控制。

【OPENAI】AI 基础与大模型实用指南

本文为初学者和技术从业者概述了什么是人工智能、其基本工作原理,以及像 ChatGPT 这样的工具如何基于大规模语言模型运行;内容旨在用清晰、通俗的方式解释关键概念与常见应用场景,并帮助读者建立进一步学习的基础。文章侧重直观解释而非深度数学推导,适合作为入门参考。

【GOOGLE】Chrome 一键化 AI 提示技能

Google 在 Chrome 中推出 Skills(技能),允许用户将常用的 AI 提示保存为可一键运行的工作流,并在当前或多个标签页上复用。新功能同时提供技能库、可编辑的自定义技能,以及与 Gemini in Chrome 一致的安全与隐私保护,目前在 Mac、Windows 和 ChromeOS(英语-美国语言)分批推送。

【GOOGLE】Google 桌面版应用全球上线

Google 将升级后的桌面应用在全球(英文版)为 Windows 用户推出,内置 AI 模式,可在桌面直接获得带网页链接的 AI 回答并在工作流中保持连续。应用支持快捷键呼出、屏幕共享与 Lens 截图搜索,既能检索网络信息也能搜索本地文件与 Google Drive。

【GOOGLE】Gemini Robotics-ER 1.6 推出

Google 发布 Gemini Robotics-ER 1.6,作为面向机器人任务的推理优先模型升级,提升空间逻辑、多视角理解、任务规划与成功检测等关键能力,并新增仪表读数功能。该模型在对抗性空间推理上展现更佳安全合规性,开发者可通过 Gemini API 与 Google AI Studio 使用。