Google 宣布 Gemini in Sheets 在公开基准 SpreadsheetBench 上取得 70.48% 的成功率,达到处理真实复杂表格编辑任务的最新水平,接近人类专家表现。该功能作为 Google Workspace 测试版推出,可用于生成、组织和编辑整张表格,覆盖从基础操作到复杂数据分析的场景。
- 背景
- Gemini in Sheets 是 Google 在 Workspace 中整合的生成式 AI 功能,能根据自然语言指令创建、组织和编辑表格。
- 关键成果
- 在公共基准 SpreadsheetBench 上取得 70.48% 成功率。
- 表现超越其他竞争模型,并接近人类专家水平。
- 功能与应用场景
- 支持从基础任务(如公式、格式)到复杂的数据分析与重构。
- 通过描述需求即可自动化修改整张表格,适合数据清洗、报表生成和批量编辑。
- 可用性
- 作为 Google Workspace 的测试版功能发布,详见 Google 的后续 Workspace 更新文章。
- 限制与注意
- 成绩基于 SpreadsheetBench;现实使用中仍需验证在特定行业数据和隐私约束下的可靠性。
- 作为自动化工具,仍建议人工复核关键数据和公式。
这一进展显示 Google 在将大型模型实装到办公场景上的竞争力,但实际生产环境仍需谨慎验证与审计。