DeepSeek-R1 logo

DeepSeek-R1

開く

DeepSeekの最新オープンソース推論モデル、OpenAI o1に近い推理能力を持つ、完全オープンソースの671Bパラメータモデル。

共有:

DeepSeek-R1は、DeepSeekが2025年1月に発表した最新世代のオープンソース推論モデルで、671Bパラメータを搭載しています。OpenAI o1の推論能力に近づいた初のオープンソースモデルとして、DeepSeek-R1は強化学習を通じて複雑な推論タスクで画期的なパフォーマンスを実現し、数学、コーディング、科学推論で世界トップクラスのレベルに達しています。

コア機能

  • トップクラスの推論: 複数の推論ベンチマークでOpenAI o1に近づくまたは超える
  • 完全オープンソース: 671Bパラメータモデルウェイトが完全公開
  • RL訓練: 強化学習により推論能力を大幅向上
  • 可視化された思考チェーン: 生成過程で詳細な推論ステップを表示
  • 多領域での卓越性: 数学、プログラミング、科学、論理推論でリード
  • 蒸留バージョン: より簡単なデプロイのための複数の小型蒸留モデル

パフォーマンスベンチマーク

  • AIME 2024: 79.8% (o1レベルに接近)
  • MATH-500: 97.3% (オープンソース最高)
  • Codeforces: 96.3% (Div.2レベル)
  • HumanEval: 98.0%+
  • GPQA Diamond: 71.5%

モデルシリーズ

  • DeepSeek-R1 (671B): フルモデル、最強の推論
  • R1-Distill (32B/14B/8B/1.5B): 80%+の能力を保持、コンシューマーハードウェア対応

使用ケース

  1. 数学問題の解決
  2. 複雑なプログラミングとアルゴリズム
  3. 科学研究の推論
  4. 論理分析と意思決定
  5. 詳細なステップを持つ教育支援

デプロイメント

  • クラウド: DeepSeek API、主要クラウドプロバイダー
  • ローカルフル (671B): 最小8x A100 80GB
  • Distill-32B: 2x RTX 4090
  • Distill-8B: RTX 4090 1枚

ライセンス

  • MITライセンス: 商用利用完全オープン
  • モデルウェイト: 完全にダウンロード可能
  • 研究フレンドリー: 学術研究を奨励

まとめ

DeepSeek-R1は、オープンソースAI推論の重大な突破口を表し、671Bパラメータでo1に近い推論能力を実現しました。革新的なRL訓練と包括的なモデル蒸留により、強力な研究ベースラインとデプロイ可能な高性能推論ソリューションの両方を提供し、AI推論技術の民主化を大きく前進させています。

コメント

まだコメントがありません。最初のコメントを投稿してください!