MarkItDown Skill logo

MarkItDown Skill

開く

ファイルとオフィス文書を Markdown に変換 - PDF、DOCX、PPTX、XLSX、OCR 付き画像、音声転写などをサポート。

共有:

MarkItDown - ファイルから Markdown への変換

Microsoft の Python ツールで、さまざまなファイル形式を Markdown に変換 - LLM フレンドリーでトークン効率的なフォーマット。

主な利点

  • 文書をクリーンで構造化された Markdown に変換
  • LLM 処理のためのトークン効率的なフォーマット
  • 15 以上のファイル形式をサポート
  • オプションの AI 強化画像説明
  • 画像とスキャンされた文書の OCR
  • 音声ファイルの音声転写

サポートされているフォーマット

PDF、DOCX、PPTX、XLSX、画像(OCR 付き)、音声(転写付き)、HTML、CSV、JSON、XML、ZIP、YouTube URL、EPub など。

使用例

  • 研究論文を Markdown に変換
  • スキャンされた文書からテキストを抽出
  • プレゼンテーションスライドを処理
  • 音声録音を転写
  • LLM 分析のために文書を準備

ソース:https://github.com/microsoft/markitdown ライセンス:MIT

コメント

まだコメントがありません。最初のコメントを投稿してください!