日文漫画PDF处理工具集,支持文本提取、自动注释、翻译等功能。
通过字号字体过滤掉不需要的假名标注,有LP文本和普通文本两种导出模式,支持输入PDF密码。
把PDF中的原文右上角添加注释,显示字体字号信息。
Acrobat导出PDF注释内容,加粗部分用【】括号包裹。
导出基础上加上注释的作者和主题,配合自动生成注释脚本可以获取原文字体和字号信息,配合导入脚本可实现全自动嵌字。
批量合并PDF,自动排序。放在PDF文件夹下运行或者运行后选择PDF文件夹。当选择的文件夹内没有PDF的时候合并图片。
pdf-auto-trans是给漫画PDF添加翻译注释的自动化命令行工具,支持多种翻译API。
pip install -r requirements.txt依赖列表:
flask- Web服务器pdfplumber- PDF文本提取pymupdf- PDF处理和操作requests- HTTP请求pandas- 数据处理openpyxl- Excel文件读写pypdf- PDF合并分割pillow- 图片处理
- 在"更多工具"中找到"指引式操作"(旧版本叫"动作向导")
- 管理自定义命令
- 导入XML命令文件或sequ动作文件
- 打开PDF文件,在动作向导工具中点击命令运行
- Windows 10以上版本:exe直接运行
- Mac系统:需配置Python环境
注意:Python不能获取注释中加粗的字,建议使用Acrobat Pro JS脚本导出。
manga-PDF-Script/
├── 文本提取/ # 日文PDF文本提取工具
├── 生成注释/ # PDF自动生成注释
├── 导出注释/ # PDF注释导出工具
├── 合并pdf/ # PDF合并工具
├── BTjson生成注释PDF/ # BTJSON转PDF
├── pdf-auto-trans/ # PDF自动翻译工具
│ └── pdf-auto-trans-cli/ # 命令行工具
├── img/ # 图片资源
└── requirements.txt # Python依赖


