100% 离线语音识别桌面端 — Private, Local Speech-to-Text
基于 moonshine / Faster-Whisper 的本地 ASR 引擎,支持实时录音转写、音频文件转写、SRT 字幕导出。
- 🎤 实时转写 — 按住说话,实时显示文字
- 📁 文件转写 — 支持 mp3, wav, m4a, ogg, flac, aac
- 📝 多格式导出 — SRT 字幕 / TXT / JSON
- 🔒 100% 离线 — 所有模型本地运行,隐私无忧
- ⚡ GPU 加速 — CUDA / MPS / CPU 自动适配
- 🌐 多语言 — 中文、英文、日文、韩文、多语言
# 1. 克隆项目
cd edgespeech-desktop
# 2. 安装系统依赖(macOS)
brew install portaudio ffmpeg
# 3. 安装 Python 依赖
bash install.sh
# 4. 安装 Electron 依赖
npm install
# 5. 启动应用
npm start| 模型 | 引擎 | 大小 | 语言 | 速度 |
|---|---|---|---|---|
| Moonshine Tiny | moonshine | ~80MB | 英文 | ⚡⚡⚡ |
| Moonshine Base | moonshine | ~200MB | 英文 | ⚡⚡ |
| Faster-Whisper Tiny | faster-whisper | ~75MB | 多语言 | ⚡⚡⚡ |
| Faster-Whisper Base | faster-whisper | ~140MB | 多语言 | ⚡⚡ |
- Electron 28(桌面端)
- FastAPI + Uvicorn(Python REST API,端口 3358)
- Moonshine / Faster-Whisper(ASR 引擎)
- Silero-VAD(语音活动检测)
- Vanilla JS/CSS(无前端框架)
| 按键 | 功能 |
|---|---|
Space |
按住说话(录音期间) |
Cmd/Ctrl+C |
复制转写结果 |
- 模型缓存:
~/.edgespeech/models/ - 历史记录:
~/.edgespeech/history.db - 已安装模型:
~/.edgespeech/installed_models.json
MIT