MarkItDown Skill logo

MarkItDown Skill

打开

将文件和办公文档转换为 Markdown - 支持 PDF、DOCX、PPTX、XLSX、带 OCR 的图像、音频转录等。

分享:

MarkItDown - 文件到 Markdown 转换

Microsoft 的 Python 工具,用于将各种文件格式转换为 Markdown - LLM 友好、令牌高效的格式。

核心优势

  • 将文档转换为干净、结构化的 Markdown
  • LLM 处理的令牌高效格式
  • 支持 15+ 种文件格式
  • 可选的 AI 增强图像描述
  • 图像和扫描文档的 OCR
  • 音频文件的语音转录

支持的格式

PDF、DOCX、PPTX、XLSX、图像(带 OCR)、音频(带转录)、HTML、CSV、JSON、XML、ZIP、YouTube URL、EPub 等。

用例

  • 将研究论文转换为 Markdown
  • 从扫描文档中提取文本
  • 处理演示幻灯片
  • 转录音频录音
  • 为 LLM 分析准备文档

来源:https://github.com/microsoft/markitdown 许可证:MIT

评论

还没有评论。成为第一个评论的人!