【GOOGLE】Gemini Embedding 2 正式可用

Google 宣布 Gemini Embedding 2 正式通过 Gemini API 和 Vertex AI 对外提供,预览期内已被用于电商检索与视频分析等多模态原型。该向量嵌入以原生多模态能力为特色,旨在简化跨文本、图像、视频和音频的检索与推理管道,提升从原型到生产的稳定性与优化。

  • 概要
  • Gemini Embedding 2 已进入一般可用(GA),可通过 Gemini API 和 Vertex AI 访问。
  • 特性与定位
  • 原生多模态嵌入:同时支持文本、图像、视频、音频的联合表示,降低构建跨模态检索/推理系统的复杂度。
  • 生产就绪:在预览期间展示了多种原型(如高级电商发现、视频分析工具),GA 版本提供稳定性与性能优化,便于迁移到生产环境。
  • 适用场景
  • 多模态搜索与检索(跨文本/图像/视频/音频)
  • 内容理解与聚合(如电商推荐、媒体分析)
  • 简化以往需多套管线才能完成的任务
  • 可获取方式
  • 通过 Gemini API 直接调用
  • 在 Vertex AI 中集成使用,便于在 Google Cloud 上部署与扩展
  • 说明与影响
  • 作为支撑多项 Google 产品的核心技术,GA 版本将研究成果向开发者社群开放,推动多模态应用落地。

原生多模态嵌入让跨媒体检索与推理更简单,但实际效果与成本仍需在大规模生产场景检验。

原文链接

Leave a Comment