Skip to content

foxden-app/ChuanDoc

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

解码红书 Paper Converter

这是一个用于将 Markdown 格式的论文(通常是翻译后的双语版本)转换为排版精美的 PDF 和 DOCX 文档的工具。

功能特点

  • 自动排版:生成同名的 PDF 和 DOCX 文件。
  • 页眉页脚:支持自定义页眉(如论文标题)和页脚(如版权/翻译声明)。
  • 公式支持:自动处理 LaTeX 公式,修复常见的 OCR 错误。
  • 双语优化:在 DOCX 中优化中英文段落间距。
  • 模板支持:支持使用 DOCX 模板(--refdoc)来控制输出样式。

环境要求

在运行之前,需要安装以下依赖(以 Ubuntu/Debian 为例):

sudo apt update
sudo apt install pandoc texlive-xetex texlive-latex-recommended fonts-noto-cjk
  • Pandoc: 文档转换核心工具。
  • XeLaTeX: 用于生成 PDF 的排版引擎。
  • Noto CJK 字体: 确保 PDF 中文不乱码。

使用方法

基本用法

./chuandoc <输入Markdown文件> [选项]

选项说明

选项 说明
--source <文件> 指定英文原文 Markdown 文件,用于自动提取页眉标题(默认使用输入文件的首个一级标题)。
--title <标题> 直接指定页眉显示的英文标题(优先级最高)。
--footer <文本> 指定页脚文本。默认值为:翻译整理by钏--e/acc WX:chuaneacc
--outdir <目录> 指定输出目录(默认为输入文件所在目录)。
--refdoc <文件> 指定 DOCX 样式模板文件。如果模板中包含 HEADER_TITLEFOOTER_TEXT 占位符,会被自动替换。

示例

./chuandoc "DeepSeek-V3.2.md" \
  --title "DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models" \
  --footer "翻译整理by钏--e/acc   WX:chuaneacc"

常见问题

  1. PDF 生成失败

    • 检查是否安装了 texlive-xetexfonts-noto-cjk
    • 检查 Markdown 中是否有未转义的特殊 LaTeX 字符。
  2. DOCX 样式不对

    • 请尝试使用 --refdoc 指定一个包含正确样式的 reference docx 文件。

项目结构

  • chuandoc: 主脚本文件。
  • templates/: 存放 DOCX 模板文件。
  • scripts/: 辅助脚本。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors