文本生成场景视频 Text To Scene Video
- 控制面板: Gradio
- 核心实现:
- 文本转语音:ChatTTS
- 支持多角色文稿输入,
- 支持从文稿中拆解角色
- 选择角色对应形象和声音种子
- 根据角色文稿,生成对应音频
- 根据角色文稿和音频,生成角色动态形象,识别文稿中[laugh],显示大笑表情
- 根据角色文稿和音频,生成带角色名称前缀的srt字幕文件
- 合并视频、音频、字幕,生成字幕嵌入式像素视频
-
场景背景选择和加载
- 从 assets/background 目录加载背景图片
- 支持背景切换和预览
- 背景图片自适应缩放
-
角色形象选择和加载
- 从 assets/avatar 目录加载角色头像
- 支持多角色添加/删除
- 角色位置可调整
- 支持角色表情切换预览
-
场景编辑器界面
- 顶部工具栏:添加角色(+)、切换背景按钮
- 左侧角色列表:显示当前场景中的角色
- 主画布:显示背景和角色
- 最多支持3个角色同时显示
-
角色交互功能
- 点击角色进入编辑状态,显示红色边框
- 编辑状态下可拖拽调整位置
- 编辑状态下显示删除按钮
- 拖拽时自动限制在画面边界内
-
资源选择功能
- 支持从资源目录加载背景和头像
- 资源选择时显示预览图
- 支持滚动浏览多个资源