Google 推出 Lyria 3 与 Lyria 3 Pro,在公测阶段通过 Gemini API 与 Google AI Studio 面向开发者开放,支持从 30 秒片段到约三分钟的整曲生成,具备更强的结构感、真实人声和多模态输入能力,并内建 SynthID 水印以增强可识别性与透明度。开发者可在 AI Studio 的文本与作曲器模式中精细控制节拍、歌词时序与基于图像的情绪引导,加速原型与产品集成。
概览
– 两个公开预览型号:Lyria 3 Pro(lyria-3-pro-preview)用于约三分钟的整曲、工作室级结构感;Lyria 3 Clip(lyria-3-clip-preview)用于高并发的 30 秒片段和快速原型。
音质与功能亮点
– 支持带情感的逼真人声与更清晰的音色表现。
– 跨语言与多风格支持:可生成不同语言的主唱与从流行到放克等多种曲风。
精细控制能力
– 节拍控制(Tempo conditioning):通过自然语言指定快慢节奏以精确匹配应用节奏。
– 时间对齐歌词(Time-aligned lyrics):在提示中指定歌词何时开始与结束,控制段落时序。
– 图像到音乐的多模态输入:可用图片影响音轨的情绪与风格。
开发者体验
– 在 Google AI Studio 提供付费 API key 的专用创作空间。
– 两种创作模式:文本模式(用自然语言描述整体参数)和作曲器模式(逐段构建,设置时长、强度与描述)。
可用性与透明度
– 公测全球开放:开发者即可通过 Gemini API 或 AI Studio 使用两种型号。
– 每条生成音频包含 SynthID 数字水印,便于识别与验证 AI 生成内容。
资源链接(原文指引)
– 在 AI Studio 的模型下拉选择 Lyria 3(30s)或 Lyria 3 Pro(Full Song)开始体验。
– 查阅 Music Generation Guide、API 文档与 Cookbook 获取示例与集成代码。
Lyria 3 把可控性与多模态输入做得更完善,适合快速原型和高质量整曲生成,但合规与版权使用仍需关注。