GitHub - Prorise-cool/CSDNScraper: 抓取付费VIP文档内容自动解析Markdown格式保存本地Typora笔记

简介

CSDNScraper 是一个基于 Python 和 PyQt6 开发的图形用户界面（GUI）应用程序，旨在帮助用户轻松爬取 CSDN 文章，并将其保存为 Markdown 格式。该工具支持同时输入多个 URL 进行批量爬取，并提供便捷的保存路径设置功能。

功能特性

多 URL 支持：一次性输入多个 CSDN 文章的 URL，程序将逐一爬取并生成独立的 Markdown 文件。
HTML 内容解析：支持直接输入或粘贴 HTML 内容，并将其附加到统一的 Markdown 笔记中。
自动处理图片：自动下载并转换文章中的图片为 Markdown 格式。
配置管理：通过配置文件管理保存路径，方便用户自定义文件存储位置。
错误处理与反馈：实时显示爬取进度，并在爬取完成后提供详细的结果反馈。

演示视频

观看项目的使用演示视频：Bilibili 视频链接

安装与配置

前提条件

Python 3.7 或更高版本：请确保您的系统已安装 Python。可以通过以下命令检查 Python 版本：
```
python --version
```

安装依赖

使用 pip 安装项目所需的外部库：

pip install -r requirements.txt

注意：如果您没有 requirements.txt 文件，可以手动安装所需的库：

pip install requests beautifulsoup4 html2text PyQt6

配置设置

初次运行程序时，默认的保存路径为用户主目录。您可以通过程序的“设置保存路径”按钮自定义保存目录。

使用方法

运行程序

在项目根目录下运行以下命令启动应用程序：
```
python main.py
```
说明：确保您当前位于包含 main.py 文件的目录。
输入 URL 或 HTML 内容
- 爬取多个 CSDN 文章：
  - 在文本输入框中，每行输入一个 CSDN 文章的 URL。
  - 例如：
```
https://blog.csdn.net/username/article/details/123456789
https://blog.csdn.net/username/article/details/987654321
```
- 解析 HTML 内容：
  - 直接粘贴或输入 HTML 内容，然后点击“解析文本”按钮，将内容附加到统一的 Markdown 文件中。
获取文章

点击“获取文章”按钮，程序将开始爬取输入的所有 URL，对应的文章将被保存为独立的 Markdown 文件。
解析文本

如果输入的是 HTML 内容，点击“解析文本”按钮，内容将被转换为 Markdown 格式并附加到 merged_notes.md 文件中。
设置保存路径

点击“设置保存路径”按钮，选择您希望保存 Markdown 文件的目录。更改后，所有后续的爬取或解析内容将保存到新的路径中。

联系方式

如果您有任何问题或建议，请通过以下方式联系我：

邮箱：3381292732@qq.com.com
GitHub：Prorise-cool
Bilibili：Prorise的Bilibili频道

感谢您使用 CSDNScraper！如果您觉得这个项目对您有帮助，请考虑给我一个 Star ⭐。

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
LICENSE		LICENSE
README.md		README.md
csdn.py		csdn.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

简介

功能特性

演示视频

安装与配置

前提条件

安装依赖

配置设置

使用方法

联系方式

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

简介

功能特性

演示视频

安装与配置

前提条件

安装依赖

配置设置

使用方法

联系方式

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages