OpenAIの最先進embeddingモデル。3072次元をサポートし、MIRACLベンチマークで54.9%を達成。Matryoshka学習による柔軟な次元削減が可能。
BAAIが開発したトップクラスのオープンソース多言語embeddingモデル。100以上の言語、8192トークンの入力長をサポートし、密検索、多ベクトル検索、疎検索の3つの検索方式を統合。
Voyage AIの最新SOTA汎用embeddingモデル。法律、金融、コードを含む100データセットにわたる8つの評価ドメインで第1位、OpenAIとCohereを平均9.74%と20.71%上回る。