一个面向 YOLO 系列目标检测模型的桌面化数据集预处理工具,用于简化常见的数据清洗、结构整理与格式校验流程。
项目以可执行程序交付为目标,同时保留完整源码,适合个人研究、课程项目及小规模工程使用。
- 目录结构校验:自动检查并整理符合 YOLO 规范的文件夹结构。
- 数据集拆分:支持一键将原始数据按比例拆分为 train / val / test 集合。
- 数据集创建:一键创建符合YOLO规范的数据集
- 数据集扩展:在原有数据集基础上加入新的数据样本
- 图形化界面:提供直观的 GUI 界面,无需任何命令行操作
- labelimg命令生成:自动生成labelimg数据标注命令
- yaml文件生成:一键生成yaml配置文件,可更改
- 便捷打包:支持通过脚本快速打包为 Windows 可执行程序(.exe)。
- 动态可交互预览树:支持可随用户构建动态构建更新预览树,且可以在预览树打开文件
📌 定位:本工具为「数据准备阶段的辅助工具」,不涉及模型训练或推理。
.
├── main.py # 程序入口
├── core/ # 核心数据处理逻辑
├── ui/ # 图形界面相关代码
├── utils/ # 通用工具函数
├── models/ # 数据结构与模型定义(不包含权重)
├── build.spec # PyInstaller 构建配置
├── release.spec # PyInstaller 发布配置
├── installer_setup.iss # Inno Setup 安装脚本
├── build_release.bat # 自动化构建脚本
├── build_installer.bat # 安装包构建脚本
├── create_portable.ps1 # 便携版创建脚本
├── ARCHITECTURE.md # 项目架构说明
├── PROJECT_STATUS.md # 当前开发状态
├── RELEASE.md # 发布说明
├── requirements.txt # 项目依赖清单
└── README.md # 项目说明(本文档)
- 前往 GitHub Releases 页面。
- 下载最新版本的安装包(Installer)或便携版(Portable)。
- 按提示安装或直接解压运行即可。
- 无需安装 Python 环境。
- Python 3.10+
- Windows 系统(GUI 与打包流程基于 Windows)
python main.py本项目使用以下工具链:
- PyInstaller:生成可执行文件。
- Inno Setup:生成 Windows 安装包。
- PowerShell / Batch:自动化构建流程。
# 生成发布版 .exe
build_release.bat
# 生成安装包
build_installer.bat详细说明请参见 ARCHITECTURE.md 与 RELEASE.md。
- 解耦设计:核心逻辑与 UI 界面完全分离,便于后续功能扩展。
- 构建分离:构建产物与源码严格分离,保持仓库整洁。
- 产品思维:以「可分发工具」而非简单的脚本为目标进行设计。
- 当前仅针对 YOLO 系列数据集格式。
- 不包含模型训练、推理或可视化功能。
- 未对超大规模数据集进行极致的性能优化测试。
本项目采用 MIT License,可自由用于学习、修改与分发。请保留原作者信息。
这是作者的第一个完整工具型开源项目,目标是将零散的实验性脚本,整理为可复用、可交付的软件工具。
欢迎提交 Issue、提供建议或改进意见!