Deepgram Nova-2 logo

Deepgram Nova-2

開く

最速の商用音声認識モデル、リアルタイム転写、高精度、多言語サポート。

共有:

Deepgram Nova-2は、リアルタイム転写に最適化された最速の商用音声認識モデルです。低レイテンシ、高精度、多言語サポートにより、リアルタイムアプリケーションのための優先STTソリューションです。

機能

  • 超高速: 業界最速のリアルタイム転写
  • 低レイテンシ: <300msレイテンシ
  • 高精度: Whisperに匹敵するWER
  • 多言語: 36言語
  • ストリーミングAPI: リアルタイムWebSocket

パフォーマンス

  • 速度: リアルタイムの40倍高速
  • レイテンシ: 平均250ms
  • 精度: WER 5-8%
  • 同時実行: 高同時実行サポート

使用ケース

  1. リアルタイムキャプション生成
  2. コールセンター転写
  3. ライブストリーム転写
  4. ビデオ会議
  5. 音声分析

価格

  • 従量課金: $0.0043/分
  • Growth: 年間割引
  • Enterprise: カスタムプラン

API機能

  • ストリーミング: リアルタイムWebSocket
  • バッチ: 大容量ファイル処理
  • ダイアライゼーション: スピーカー分離
  • キーワード: キーワードスポッティング

まとめ

Deepgram Nova-2は、超高速と低レイテンシでリアルタイム音声転写の最良の選択であり、ミリ秒応答のリアルタイムアプリケーションに最適です。

コメント

まだコメントがありません。最初のコメントを投稿してください!