MarkItDown - 文件到 Markdown 转换
Microsoft 的 Python 工具,用于将各种文件格式转换为 Markdown - LLM 友好、令牌高效的格式。
核心优势
- 将文档转换为干净、结构化的 Markdown
- LLM 处理的令牌高效格式
- 支持 15+ 种文件格式
- 可选的 AI 增强图像描述
- 图像和扫描文档的 OCR
- 音频文件的语音转录
支持的格式
PDF、DOCX、PPTX、XLSX、图像(带 OCR)、音频(带转录)、HTML、CSV、JSON、XML、ZIP、YouTube URL、EPub 等。
用例
- 将研究论文转换为 Markdown
- 从扫描文档中提取文本
- 处理演示幻灯片
- 转录音频录音
- 为 LLM 分析准备文档
来源:https://github.com/microsoft/markitdown 许可证:MIT
评论
还没有评论。成为第一个评论的人!
相关工具
Paper2Web Skill
github.com/K-Dense-AI/claude-scientific-writer
将学术论文转换为交互式网站、演示视频和会议海报 - LaTeX/PDF 转换的自动化管道。
Citation Management Skill
github.com/K-Dense-AI/claude-scientific-writer
全面的引用和参考文献管理 - 从 Google Scholar 和 PubMed 搜索、验证和格式化引用。
Clinical Decision Support Skill
github.com/K-Dense-AI/claude-scientific-writer
生成专业临床决策支持文档 - 带生物标志物分层的患者队列分析和带 GRADE 证据分级的治疗建议报告。
相关洞察
Skills + Hooks + Plugins:Anthropic 如何重新定义 AI 编程工具的扩展性
深入解析 Claude Code 的 Skills、Hooks 和 Plugins 三位一体架构,探讨为什么这种设计比 GitHub Copilot 和 Cursor 更先进,以及它如何通过开放标准重新定义 AI 编程工具的扩展性。
Claude Skills 完全指南 - 十大必备 Skills 详解
深入解析 Claude Skills 扩展机制,详细介绍十大核心技能及 Obsidian 集成,帮助你打造高效的 AI 工作流

Obsidian + Claude Skills:真正让你的知识管理效率起飞
真正让 Obsidian 起飞的,不只是接入 Claude,而是接入一整套「Claude Skills」。