Skip to content

jiuyou-dev/inference-backup-chattts

Repository files navigation

ChatTTS 推理备份仓库

开源项目

原项目地址: https://github.com/2noise/ChatTTS 许可证: BSD-3-Clause


WebUI 启动方式

# 进入仓库目录
cd inference-backup-chattts

# 启动 ChatTTS WebUI(端口 8080)
python examples/web/webui.py

启动后访问:http://localhost:8080


推理脚本启动方式

python chattts_infer.py "要说的文本内容"

参数说明

文本输入参数

参数 默认值 说明
text (必填) 输入文本内容
refine_text true 是否启用文本优化(开启语义处理)

采样参数

参数 默认值 说明
temperature 0.3 采样温度,越高越随机,越低越确定
top_p 0.65 核采样阈值,控制随机性范围
top_k 20 Top-K 采样数量,越大越多样化

语音生成参数

参数 默认值 说明 语音生成阶段
oral 4 口语化程度 0-9,越高越自然 音频生成
laugh 0 笑声概率 0-9 音频生成
break_val 5 停顿强度 0-9 音频生成
speed 6 语速 1-9,越大越快 音频生成

控制参数

参数 默认值 说明
audio_seed 1023 音频生成随机种子
text_seed 42 文本优化随机种子
split_batch 0 长文本分批大小(0=不分批)
stream_mode false 是否启用流式输出
spk_emb (留空) 音色向量(留空则随机采样音色)

语音生成流程位置

用户输入文本
    ↓
[Step 1] 文本优化(refine_text=true 时启用)
    ↓
[Step 2] 音频生成 ← oral/laugh/break_val/speed 在此阶段生效
    ↓
输出 WAV 文件

免责声明

本项目仅供学习研究使用。

  1. AI 生成的语音可能被误用于深度伪造、诈骗等非法用途
  2. 使用者需自行承担因使用本项目产生的全部风险和责任
  3. 请遵守各开源项目的许可证条款
  4. 请确保使用目的符合当地法律法规

原始开源项目责任: ChatTTS 的开发者对原项目承担完全责任,本仓库仅为备份和配置方案。


许可证

本仓库内容遵循原项目 BSD-3-Clause 许可证。

About

ChatTTS 推理仓库 | 通过WebUI调参测试,优化语音生成效果,导出参数用于feishu-voice-skill的声音生成

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages