自动下载并合并当天人民日报各版面PDF,支持命令行和 Claude Code Skill 调用。
仅限个人学习使用,若有侵权请联系删除。
基于 Kings-en/rmrb-pdf-fetcher 开发,使用 Playwright 重构。
- 自动获取人民日报当天所有版面
- 下载并合并为单个完整PDF
- 支持每天定时自动执行(默认早8点)
- 支持 Claude Code Skill 一键调用
- JSON 输出模式,便于集成
- 随机 User-Agent + 延迟,降低被拦截风险
| 依赖 | 版本要求 |
|---|---|
| Python | >= 3.11 |
| 网络访问 | 需能访问 paper.people.com.cn |
Windows:
scripts\install.batLinux / macOS:
bash scripts/install.sh安装脚本自动完成:
- 检测 Python 环境(优先使用 uv,回退到 pip + venv)
- 安装 Python 依赖
- 安装 Playwright Chromium 浏览器
- 注册 Claude Code Skill 到
~/.claude/skills/
方式一:使用 uv
git clone https://github.com/your-username/rmrb-pdf-fetcher.git
cd rmrb-pdf-fetcher
uv sync
uv run playwright install chromium方式二:使用 pip
git clone https://github.com/your-username/rmrb-pdf-fetcher.git
cd rmrb-pdf-fetcher
python -m venv .venv
# Windows
.venv\Scripts\activate
# Linux/macOS
source .venv/bin/activate
pip install -e .
playwright install chromium安装后提供 rmrb-download 命令:
# 一次性下载(最常用)
rmrb-download --once
# JSON 输出(用于集成)
rmrb-download --once --output-json
# 指定输出目录
rmrb-download --once --output-dir ~/Downloads
# 定时任务模式(默认早8点)
rmrb-downloadJSON 输出示例:
{
"success": true,
"date": "2026-04-02",
"file_path": "/path/to/人民日报下载/人民日报-2026-04-02-完整版.pdf",
"pages_count": 20,
"message": "下载完成"
}from rmrb_fetcher.downloader import download, download_with_result
# 简单下载,返回文件路径
file_path = download()
# 获取结构化结果
result = download_with_result()
print(result["success"], result["file_path"])| 参数 | 说明 |
|---|---|
--once |
执行一次下载后退出 |
--output-json |
JSON 格式输出,禁用控制台日志 |
--output-dir DIR |
指定下载输出目录 |
安装后,在 Claude Code 中可以直接使用:
/rmrb
或自然语言:
下载今天的人民日报
帮我下载人民日报PDF
获取今天的报纸
# Windows
mkdir %USERPROFILE%\.claude\skills\rmrb-pdf-fetcher
copy SKILL.md %USERPROFILE%\.claude\skills\rmrb-pdf-fetcher\
# Linux/macOS
mkdir -p ~/.claude/skills/rmrb-pdf-fetcher
cp SKILL.md ~/.claude/skills/rmrb-pdf-fetcher/项目包含 .claude/settings.json,配置了 SessionStart hook 自动检查依赖是否安装。
rmrb-pdf-fetcher/
├── src/
│ └── rmrb_fetcher/ # Python 包
│ ├── __init__.py # 包初始化
│ ├── cli.py # CLI 入口 (rmrb-download)
│ └── downloader.py # 核心下载逻辑
├── scripts/
│ ├── install.sh # Linux/macOS 一键安装
│ └── install.bat # Windows 一键安装
├── .claude/
│ └── settings.json # Claude Code hooks 配置
├── SKILL.md # Claude Code Skill 定义
├── pyproject.toml # 项目配置 & 依赖
├── requirements.txt # pip 依赖(向后兼容)
├── README.md # 本文档
├── rmrb_download_playwright.py # 独立脚本(向后兼容)
└── rmrb_download_once.py # 简化版脚本(向后兼容)
下载的文件保存在 人民日报下载/ 目录:
人民日报下载/
└── 人民日报-2026-04-02-完整版.pdf
运行日志保存在 rmrb_download.log。
# 设置国内镜像加速
set PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright # Windows
export PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright # Linux/macOS
playwright install chromium- 检查网络能否访问
paper.people.com.cn - 当天报纸通常早6点后上线
- 查看日志:
cat rmrb_download.log
python --version # 确保 >= 3.11回退到 pip:
python -m venv .venv && source .venv/bin/activate # Linux/macOS
python -m venv .venv && .venv\Scripts\activate # Windows
pip install -e .
playwright install chromium欢迎提交 Pull Request 或 Issue。
MIT License