基于 PaddleOCR + LangChain Agent 的智能错题本生成系统。上传试卷 PDF 或图片,自动识别文档结构、智能分割题目,导出为 Markdown 错题本。
需要 Python 3.11+。
pip install -r requirements.txt如需处理 PDF 文件,还需安装 poppler:
# 通过 scoop
scoop install poppler
# 或通过 choco
choco install poppler安装后重启终端,确保 pdftoppm 命令可用。
copy .env.example .env编辑 .env,填写以下必需项:
# DeepSeek API(Agent 智能分割题目)
DEEPSEEK_API_KEY=your_key
DEEPSEEK_BASE_URL=https://api.deepseek.com
# PaddleOCR API(文档结构解析)
PADDLEOCR_API_URL=your_url
PADDLEOCR_API_TOKEN=your_token可选配置见 .env.example。
python web_app.py访问 **http://localhost:5001**,拖拽上传 PDF 或图片即可使用。
PDF(.pdf)、图片(.jpg .jpeg .png .bmp .tiff .webp),单次上传限制 50 MB。
MIT License