这是一个用于将 Markdown 格式的论文(通常是翻译后的双语版本)转换为排版精美的 PDF 和 DOCX 文档的工具。
- 自动排版:生成同名的 PDF 和 DOCX 文件。
- 页眉页脚:支持自定义页眉(如论文标题)和页脚(如版权/翻译声明)。
- 公式支持:自动处理 LaTeX 公式,修复常见的 OCR 错误。
- 双语优化:在 DOCX 中优化中英文段落间距。
- 模板支持:支持使用 DOCX 模板(
--refdoc)来控制输出样式。
在运行之前,需要安装以下依赖(以 Ubuntu/Debian 为例):
sudo apt update
sudo apt install pandoc texlive-xetex texlive-latex-recommended fonts-noto-cjk- Pandoc: 文档转换核心工具。
- XeLaTeX: 用于生成 PDF 的排版引擎。
- Noto CJK 字体: 确保 PDF 中文不乱码。
./chuandoc <输入Markdown文件> [选项]| 选项 | 说明 |
|---|---|
--source <文件> |
指定英文原文 Markdown 文件,用于自动提取页眉标题(默认使用输入文件的首个一级标题)。 |
--title <标题> |
直接指定页眉显示的英文标题(优先级最高)。 |
--footer <文本> |
指定页脚文本。默认值为:翻译整理by钏--e/acc WX:chuaneacc。 |
--outdir <目录> |
指定输出目录(默认为输入文件所在目录)。 |
--refdoc <文件> |
指定 DOCX 样式模板文件。如果模板中包含 HEADER_TITLE 或 FOOTER_TEXT 占位符,会被自动替换。 |
./chuandoc "DeepSeek-V3.2.md" \
--title "DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models" \
--footer "翻译整理by钏--e/acc WX:chuaneacc"-
PDF 生成失败:
- 检查是否安装了
texlive-xetex和fonts-noto-cjk。 - 检查 Markdown 中是否有未转义的特殊 LaTeX 字符。
- 检查是否安装了
-
DOCX 样式不对:
- 请尝试使用
--refdoc指定一个包含正确样式的 reference docx 文件。
- 请尝试使用
chuandoc: 主脚本文件。templates/: 存放 DOCX 模板文件。scripts/: 辅助脚本。