MD Converter 使用文档

欢迎使用 MD Converter!这是一款强大的桌面端工具,能够将任意文件、网页、甚至包含复杂表格的图像一键转换为结构化的 Markdown 格式,同时支持接入 AI 大模型进行本地智能润色。

🚀 快速开始

下载 .exe 绿色便携版并解压后,双击运行即可使用,无需安装其他依赖(若首次使用图像 OCR 功能,程序会自动在后台下载必要的轻量级模型)。

🛡️ 100% 本地隐私安全承诺

MD Converter 采用严苛的“本地优先”架构设计,捍卫您的数据主权:
文件零泄露:所有的 PDF 解析、Office 文档转换、提取操作完全依托您电脑的硬件在本地闭环完成。
完全离线 OCR:图像识别和表格还原采用内置的深度学习模型,断网状态下依然可用,绝不将您的敏感图片上传至任何云端接口。
凭据绝对安全:如果您配置了用于智能润色的大模型 API 密钥,该密钥及所有的抓取历史记录,仅保存在您本地硬盘的 config.json 和 SQLite 数据库中,没有任何字节会被发送到第三方的遥测服务器。

📖 功能使用指南

1. 文件转换 (支持 20+ 格式)

  • 操作方法:点击左侧导航栏的“文件转换”标签,将您的 PDF、Word (docx)、PPT (pptx)、Excel (xlsx)、图片等文件拖拽到中间区域,或点击上传。
  • 核心亮点
    • 默认启用智能图片提取:会自动将 Word、PDF 中内嵌的图片提取出来,并调用本地 OCR 识别上面的文字。
    • 批量处理:支持同时拖入数十个文件,后台采用多线程高并发处理,互不阻塞。

2. 深度网页爬虫

  • 操作方法:切换到“网页爬虫”标签,输入需要抓取的文章或网页 URL。支持同时输入多个 URL(每行一个)。
  • 核心亮点
    • SPA 动态渲染支持:如果目标网站(如 Vue/React 单页应用)需要加载 JavaScript 才能显示内容,请勾选“启用 JS 动态渲染”。
    • 智能去噪:内置算法会自动剔除网页上的广告、导航栏、底部版权信息,仅提取最纯粹的正文内容。

3. 工业级图像 OCR 与表格还原

  • 操作方法:在“图像 OCR”标签页导入您的扫描件或截图。
  • 核心亮点
    • 表格结构识别 (PP-Structure):勾选该选项后,程序将精准识别图片中的网格和表格,并在 Markdown 中完美生成对应的 | 字段 | 字段 | 语法结构。
    • 支持中英文、日文、韩文、法文等多种语言的自由切换。

4. 文档无缝合并

  • 操作方法:在“文档合并”页面导入多个 .md 文件。您可以上下拖动调整合并顺序。
  • 核心亮点
    • 合并后会自动在文章开头生成 TOC 全局目录
    • 自动检测文档中的本地绝对/相对路径图片,并将其转换拼接为 Base64 内联格式。合并后的单文件发送给任何人,都不会出现图片裂掉的情况!

5. AI 智能润色排版

  • 操作方法:进入“设置”页面,配置您自己的大模型 API Key 和 Base URL(完全兼容 OpenAI 接口)。并在文件转换页面勾选开启排版功能。
  • 核心亮点:转换完成的初步 Markdown 会自动投喂给本地/云端大模型,修正错别字、统一中英文混排空格间距、优化排版格式。

⚠️ 注意事项

首次启动加载:由于内置了多个深度学习引擎,首次执行图像 OCR 或表格识别时,可能会花费较长时间初始化或下载模型文件,请耐心等待。