tooliv

文档转Markdown

将PDF、Excel、DOCX、HTML转换为Markdown

拖放或点击选择 PDF、Excel、DOCX、HTML、CSV、JSON、TXT 文件

最大50MB · 浏览器内处理,不上传服务器

输出格式

为什么要将文档转换为 Markdown?

Markdown 已成为博客、技术文档和 GitHub README 的标准格式。将现有的 PDF、Excel、DOCX 文件转为 Markdown,可以立即与 Notion、Obsidian、Hugo、Next.js 等工具兼容。所有转换都在浏览器本地处理,机密文档也可放心使用。

各格式的转换特点

PDF 每页生成一个标题头。Excel 和 CSV 数据转为 Markdown 表格。DOCX 保留标题、加粗、斜体等格式。HTML 标签转为 Markdown 语法。JSON 可渲染为代码块或结构化表格。

什么是 MDX?

MDX(Markdown + JSX)是一种可以在 Markdown 中嵌入 React 组件的扩展格式,广泛用于 Next.js、Astro、Gatsby 等现代 Web 框架的博客和文档系统。选择 MDX 模式时,会自动插入包含 title、date、description、tags 的 frontmatter,文件可直接粘贴到 CMS 中使用。

为什么扫描版 PDF 无法转换?

扫描版 PDF 将文字以图片形式存储,无法提取文本。建议先用 Google Docs(自动 OCR)或 Adobe Acrobat 的文字识别功能处理,再用本工具转换生成的 PDF。

常见问题

转换的文件会上传到服务器吗?

不会。所有转换仅在浏览器内处理,文件数据不会发送到任何外部服务器。

Excel 文件中的多个工作表如何处理?

每个工作表作为独立的章节(## 工作表名称)包含在一个 Markdown 文件中。

DOCX 文件中的图片会被转换吗?

当前版本仅转换文本和格式。图片可能被替换为 [图片] 或其 alt 文本。

相关工具