产品动态

Google 发布 Gemini Embedding 2,多模态 embedding 进入公共预览

2026-03-103 分钟

Google 在 2026 年 3 月 10 日发布 Gemini Embedding 2,可把文本、图像、音频、视频与文档放进统一向量空间。

正文

来源:Google DeepMind

发布日期:2026-03-10

原文:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/

Google 宣布 Gemini Embedding 2 进入公共预览,支持文本、图像、视频、音频和文档进入统一 embedding 空间。对企业场景而言,这意味着未来的检索和分类系统会更自然地从“纯文本 RAG”扩展到多模态知识库,尤其适合票据、文档、视频培训和知识资产混合的业务场景。