Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
@@ -0,0 +1,47 @@
### 姓名

李志军

### 实习项目

PaddleFormers 自动化训练系统开发

### 本周工作

1. **AutoTrainer 系统架构搭建**
- 完成自动化训练系统 AutoTrainer 的整体架构设计与实现
- 系统支持完整的 ML 生命周期自动化:数据处理、环境设置、消融实验、训练、评估和报告生成
- 集成 LLM 驱动的决策能力,在每个步骤实现智能化处理

2. **数据处理模块**
- 实现 ReAct 数据代理,支持任意格式数据检查(Parquet、CSV、XML、JSONL、ZIP、目录)
- 通过 LLM 自动生成 Python 转换脚本,执行并验证输出格式
- 支持自动修复和重试机制(最多 3 次尝试)
- 实现数据清洗(MD5 去重、移除错误行)、分析和训练/验证/测试集划分

3. **技能模块开发**
- `data-inspect`:理解数据模式并生成 erniekit 转换脚本
- `diagnose-training`:两级错误诊断(正则快速路径 + LLM 复杂情况分析)
- `plan-experiment`:智能迭代超参数调优,支持趋势分析和自适应搜索

4. **TUI 界面开发**
- 实现实时终端界面,支持可折叠面板
- 智能日志显示和 GPU 监控功能
- 实验进度显示在状态栏和主面板

5. **智能消融实验代理**
- 实现基于 Pearson 相关性分析的逐因子迭代调优
- 支持自适应搜索范围调整(收敛检测)
- 实现崩溃恢复和健康监控功能

6. **文档和示例**
- 完成系统架构文档和使用说明
- 编写多数据集比例优化文档和可视化脚本

### 下周计划

1. 完善系统测试用例,提高代码覆盖率
2. 优化 TUI 界面交互体验
3. 集成更多数据格式支持
4. 完善实验报告生成功能
5. 性能优化和内存管理改进
Loading