原项目地址: https://github.com/2noise/ChatTTS 许可证: BSD-3-Clause
# 进入仓库目录
cd inference-backup-chattts
# 启动 ChatTTS WebUI(端口 8080)
python examples/web/webui.py启动后访问:http://localhost:8080
python chattts_infer.py "要说的文本内容"| 参数 | 默认值 | 说明 |
|---|---|---|
text |
(必填) | 输入文本内容 |
refine_text |
true | 是否启用文本优化(开启语义处理) |
| 参数 | 默认值 | 说明 |
|---|---|---|
temperature |
0.3 | 采样温度,越高越随机,越低越确定 |
top_p |
0.65 | 核采样阈值,控制随机性范围 |
top_k |
20 | Top-K 采样数量,越大越多样化 |
| 参数 | 默认值 | 说明 | 语音生成阶段 |
|---|---|---|---|
oral |
4 | 口语化程度 0-9,越高越自然 | 音频生成 |
laugh |
0 | 笑声概率 0-9 | 音频生成 |
break_val |
5 | 停顿强度 0-9 | 音频生成 |
speed |
6 | 语速 1-9,越大越快 | 音频生成 |
| 参数 | 默认值 | 说明 |
|---|---|---|
audio_seed |
1023 | 音频生成随机种子 |
text_seed |
42 | 文本优化随机种子 |
split_batch |
0 | 长文本分批大小(0=不分批) |
stream_mode |
false | 是否启用流式输出 |
spk_emb |
(留空) | 音色向量(留空则随机采样音色) |
用户输入文本
↓
[Step 1] 文本优化(refine_text=true 时启用)
↓
[Step 2] 音频生成 ← oral/laugh/break_val/speed 在此阶段生效
↓
输出 WAV 文件
本项目仅供学习研究使用。
- AI 生成的语音可能被误用于深度伪造、诈骗等非法用途
- 使用者需自行承担因使用本项目产生的全部风险和责任
- 请遵守各开源项目的许可证条款
- 请确保使用目的符合当地法律法规
原始开源项目责任: ChatTTS 的开发者对原项目承担完全责任,本仓库仅为备份和配置方案。
本仓库内容遵循原项目 BSD-3-Clause 许可证。