Skip to content

ZSeven-W/edgespeech-desktop

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

EdgeSpeech-Desktop

100% 离线语音识别桌面端 — Private, Local Speech-to-Text

基于 moonshine / Faster-Whisper 的本地 ASR 引擎,支持实时录音转写、音频文件转写、SRT 字幕导出。

功能

  • 🎤 实时转写 — 按住说话,实时显示文字
  • 📁 文件转写 — 支持 mp3, wav, m4a, ogg, flac, aac
  • 📝 多格式导出 — SRT 字幕 / TXT / JSON
  • 🔒 100% 离线 — 所有模型本地运行,隐私无忧
  • GPU 加速 — CUDA / MPS / CPU 自动适配
  • 🌐 多语言 — 中文、英文、日文、韩文、多语言

安装

# 1. 克隆项目
cd edgespeech-desktop

# 2. 安装系统依赖(macOS)
brew install portaudio ffmpeg

# 3. 安装 Python 依赖
bash install.sh

# 4. 安装 Electron 依赖
npm install

# 5. 启动应用
npm start

支持的 ASR 模型

模型 引擎 大小 语言 速度
Moonshine Tiny moonshine ~80MB 英文 ⚡⚡⚡
Moonshine Base moonshine ~200MB 英文 ⚡⚡
Faster-Whisper Tiny faster-whisper ~75MB 多语言 ⚡⚡⚡
Faster-Whisper Base faster-whisper ~140MB 多语言 ⚡⚡

技术栈

  • Electron 28(桌面端)
  • FastAPI + Uvicorn(Python REST API,端口 3358)
  • Moonshine / Faster-Whisper(ASR 引擎)
  • Silero-VAD(语音活动检测)
  • Vanilla JS/CSS(无前端框架)

快捷键

按键 功能
Space 按住说话(录音期间)
Cmd/Ctrl+C 复制转写结果

数据存储

  • 模型缓存:~/.edgespeech/models/
  • 历史记录:~/.edgespeech/history.db
  • 已安装模型:~/.edgespeech/installed_models.json

License

MIT

About

Offline speech recognition desktop app

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors