Skip to content

MindMobius/TTSV

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TTSV

文本生成场景视频 Text To Scene Video

  • 控制面板: Gradio
  • 核心实现:
  • 文本转语音:ChatTTS

功能需求

  1. 支持多角色文稿输入,
  2. 支持从文稿中拆解角色
  3. 选择角色对应形象和声音种子
  4. 根据角色文稿,生成对应音频
  5. 根据角色文稿和音频,生成角色动态形象,识别文稿中[laugh],显示大笑表情
  6. 根据角色文稿和音频,生成带角色名称前缀的srt字幕文件
  7. 合并视频、音频、字幕,生成字幕嵌入式像素视频

功能实现

基础场景构建

  1. 场景背景选择和加载

    • 从 assets/background 目录加载背景图片
    • 支持背景切换和预览
    • 背景图片自适应缩放
  2. 角色形象选择和加载

    • 从 assets/avatar 目录加载角色头像
    • 支持多角色添加/删除
    • 角色位置可调整
    • 支持角色表情切换预览
  3. 场景编辑器界面

    • 顶部工具栏:添加角色(+)、切换背景按钮
    • 左侧角色列表:显示当前场景中的角色
    • 主画布:显示背景和角色
    • 最多支持3个角色同时显示
  4. 角色交互功能

    • 点击角色进入编辑状态,显示红色边框
    • 编辑状态下可拖拽调整位置
    • 编辑状态下显示删除按钮
    • 拖拽时自动限制在画面边界内
  5. 资源选择功能

    • 支持从资源目录加载背景和头像
    • 资源选择时显示预览图
    • 支持滚动浏览多个资源

鸣谢

About

文本生成视觉小说视频 Text generates visual novel video

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages