OpenAI 最先进的 embedding 模型,支持 3072 维向量,在 MIRACL 基准测试中得分 54.9%,采用 Matryoshka 学习支持灵活的维度缩减。
BAAI 开发的顶级开源多语言 embedding 模型,支持 100+ 种语言、8192 tokens 输入长度,同时支持密集检索、多向量检索和稀疏检索三种检索方式。
Voyage AI 最新的 SOTA 通用 embedding 模型,在 8 个评估领域的 100 个数据集中排名第一,平均超越 OpenAI 和 Cohere 9.74% 和 20.71%。