NV-Embed-v2 是 NVIDIA 推出的高性能嵌入模型,在 MTEB 基准测试中名列前茅。专为检索任务优化,支持 4096 tokens 长上下文,是企业级 RAG 和搜索应用的理想选择。
核心特性
- MTEB第一: 在MTEB榜单上名列前茅
- 长上下文: 支持4096 tokens
- 检索优化: 专为RAG优化
- 高效推理: GPU加速,速度快
- 开源: 模型权重开放
性能
- MTEB平均: 69.3分(排名第一)
- 检索任务: nDCG@10业界领先
- 分类准确度: 高准确率
- 语义相似度: 精准匹配
应用场景
- RAG系统文档嵌入
- 企业级语义搜索
- 问答系统检索
- 文档相似度计算
- 知识图谱构建
部署
- NVIDIA API: 云端API
- 本地部署: GPU推理
- 优化: TensorRT加速
总结
NV-Embed-v2 以 MTEB 榜首的性能,成为检索任务的最佳嵌入模型。长上下文和开源特性使其成为企业RAG应用的理想选择。
评论
还没有评论。成为第一个评论的人!
相关工具
BGE-M3
huggingface.co/BAAI/bge-m3
BAAI 开发的顶级开源多语言 embedding 模型,支持 100+ 种语言、8192 tokens 输入长度,同时支持密集检索、多向量检索和稀疏检索三种检索方式。
Models
Cohere Embed v3
cohere.com
Cohere企业级嵌入模型Embed v3,支持100+语言和多任务场景(检索、分类、聚类),在MTEB基准中表现优异,支持int8量化压缩,是企业搜索和RAG应用的理想选择。
Models
EmbeddingGemma
ai.google.dev/gemma
Google DeepMind 的轻量级多语言文本嵌入模型,专为设备端 AI 优化,内存占用小于 200MB。
Models
相关洞察
别再把 AI 助手塞进聊天框了:Clawdbot 选错了战场
Clawdbot 很方便,但将它放在 Slack 或 Discord 里操控,是从一开始就错的设计选择。聊天工具不是用来操作任务的,AI 也不是用来聊天的。
低代码平台的黄昏:为什么 Claude Agent SDK 会让 Dify 们成为历史
从大模型第一性原理深度剖析为什么 Claude Agent SDK 将取代 Dify。探讨为什么自然语言描述流程比图形化编排更符合人类原始行为模式,以及为什么这是 AI 时代的必然选择。

Obsidian + Claude Skills:真正让你的知识管理效率起飞
真正让 Obsidian 起飞的,不只是接入 Claude,而是接入一整套「Claude Skills」。