English | 中文
MindSpore Model Agent 是一个面向 MindSpore 生态的、聚焦模型训练场景的 AI agent solution。它面向模型训练周边高频工程工作而设计,适用于那些仅靠通用代码生成还不够、还需要训练领域专项能力支持的场景。
它由两个紧密相关的部分组成:
mindspore-skills:面向模型训练与调试任务的领域能力层,提供可复用的技能,包括 readiness 检查、failure diagnosis、accuracy analysis、performance analysis、model migration、algorithm adaptation 和 operator implementation。这些 skills 不仅可用于 MindSpore Model Agent,也可以与 Claude Code、OpenCode、Codex 等其他 agentic CLI 环境配合使用。mindspore-cli:MindSpore Model Agent 的官方 CLI。它与相关 skills 有更好的集成,并针对模型训练场景进行了优化,提供更统一的端到端训练任务交互体验。
最新版本:MindSpore Model Agent v0.1.3。更新历史请参见 changelog.md。
亮点包括:
[skills]新增 Ascend A2 模型训练运行时失败报错、精度偏移和性能瓶颈的基础分析能力。[skills]新增 Hugging Face Transformers 模型迁移支持,并将mhc/attn-residual集成到 Qwen3 skill 模板中。[skills]集成openjiuwen claw,并提供精度定位示例与部署指南。[cli]优化任务执行过程中的实时反馈,包括隐藏工具调用组装期间的状态展示。[cli]新增编辑类工具结果的 diff 视图,并优化工具调用转录内容的布局与可读性。[cli]修复流式输出截断场景下 shell 中断处理问题,统一 bug / issue 数据结构,并修复 GitCode 不兼容的安装示例。
MindSpore CLI 是 MindSpore Model Agent 的官方端到端交互入口。它面向训练任务工作流提供统一的 CLI 体验,并与方案背后的相关 skills 做更紧密的集成。
curl -fsSL https://raw.githubusercontent.com/mindspore-lab/mindspore-cli/main/scripts/install.sh | bash需要 Go 1.24.2+:
git clone https://github.com/mindspore-lab/mindspore-cli.git
cd mindspore-cli
go build -o mscli ./cmd/mscli
./msclimscli
# 首次运行时选择 "mscli-provided" → "kimi-k2.5 [free]"export MSCLI_API_KEY=sk-...
export MSCLI_MODEL=deepseek-chat
mscli# OpenAI
export MSCLI_PROVIDER=openai-completion
export MSCLI_API_KEY=sk-...
export MSCLI_MODEL=gpt-4o
# Anthropic
export MSCLI_PROVIDER=anthropic
export MSCLI_API_KEY=sk-ant-...
export MSCLI_MODEL=claude-sonnet-4-20250514
# OpenRouter
export MSCLI_PROVIDER=openai-completion
export MSCLI_API_KEY=sk-or-...
export MSCLI_BASE_URL=https://openrouter.ai/api/v1
mscli请参阅 贡献者指南 了解代码风格、依赖规则和测试规范。