BAAI bge-reranker-v2.5-gemma2-lightweight logo

BAAI bge-reranker-v2.5-gemma2-lightweight

開く

Google Gemma 2アーキテクチャベースの軽量リランキングモデル。2.6Bパラメータで中国語と英語に最適化、コンシューマーグレードGPUで動作。

共有:

BAAI bge-reranker-v2.5-gemma2-lightweight

BAAIのbge-reranker-v2.5-gemma2-lightweightは、Google Gemma 2アーキテクチャに基づく軽量リランキングモデルで、2024年11月にリリースされました。高性能を維持しながら計算リソース要件を大幅に削減し、コンシューマーグレードGPUやCPUでの効率的な動作を可能にします。

主要機能

  • 軽量: 2.6Bパラメータ - 大型モデルより大幅に少ない
  • コンシューマーハードウェア: RTX 3060、GTX 1080Ti等のGPUで動作
  • 中国語-英語最適化: 中国語と英語に深く最適化
  • C-MTEB SOTA: C-MTEBリランキングタスクで最先端
  • Gemma 2ベース: GoogleのGemma 2アーキテクチャを採用
  • Apache 2.0: 完全オープンソース

パフォーマンス

  • C-MTEBリランキング: 第1位
  • コンテキスト長: 8192トークン
  • 推論速度: 7B+モデルより3-5倍高速
  • メモリ: 4-6GB VRAM/RAMのみ必要

クイックスタート

from FlagEmbedding import FlagReranker

reranker = FlagReranker('BAAI/bge-reranker-v2.5-gemma2-lightweight', use_fp16=True)
scores = reranker.compute_score([[query, doc1], [query, doc2]])

最適な用途

✅ 中国語中心のアプリケーション ✅ リソース制約のある環境 ✅ コスト重視のプロジェクト ✅ エッジデプロイメント ✅ 高速レスポンス要件

代替案

  • BGE-reranker-large: より高い精度が必要でGPUリソースが豊富
  • Jina Reranker v3: 広範な多言語サポートが必要
  • Cohere Rerank v3.5: マネージドサービスが必要

コメント

まだコメントがありません。最初のコメントを投稿してください!