【GOOGLE】Lyria 3：面向开发者的音乐生成引擎

Google 推出 Lyria 3 与 Lyria 3 Pro，在公测阶段通过 Gemini API 与 Google AI Studio 面向开发者开放，支持从 30 秒片段到约三分钟的整曲生成，具备更强的结构感、真实人声和多模态输入能力，并内建 SynthID 水印以增强可识别性与透明度。开发者可在 AI Studio 的文本与作曲器模式中精细控制节拍、歌词时序与基于图像的情绪引导，加速原型与产品集成。

概览
– 两个公开预览型号：Lyria 3 Pro（lyria-3-pro-preview）用于约三分钟的整曲、工作室级结构感；Lyria 3 Clip（lyria-3-clip-preview）用于高并发的 30 秒片段和快速原型。

音质与功能亮点
– 支持带情感的逼真人声与更清晰的音色表现。
– 跨语言与多风格支持：可生成不同语言的主唱与从流行到放克等多种曲风。

精细控制能力
– 节拍控制（Tempo conditioning）：通过自然语言指定快慢节奏以精确匹配应用节奏。
– 时间对齐歌词（Time-aligned lyrics）：在提示中指定歌词何时开始与结束，控制段落时序。
– 图像到音乐的多模态输入：可用图片影响音轨的情绪与风格。

开发者体验
– 在 Google AI Studio 提供付费 API key 的专用创作空间。
– 两种创作模式：文本模式（用自然语言描述整体参数）和作曲器模式（逐段构建，设置时长、强度与描述）。

可用性与透明度
– 公测全球开放：开发者即可通过 Gemini API 或 AI Studio 使用两种型号。
– 每条生成音频包含 SynthID 数字水印，便于识别与验证 AI 生成内容。

资源链接（原文指引）
– 在 AI Studio 的模型下拉选择 Lyria 3（30s）或 Lyria 3 Pro（Full Song）开始体验。
– 查阅 Music Generation Guide、API 文档与 Cookbook 获取示例与集成代码。

Lyria 3 把可控性与多模态输入做得更完善，适合快速原型和高质量整曲生成，但合规与版权使用仍需关注。

原文链接

Leave a Comment Cancel reply