简体中文 | English
MoneyPrinterTurbo-LocalCN 是基于原版 MoneyPrinterTurbo 的本地优先中文创作者增强版。只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、按文案匹配视频素材、生成本地配音/字幕/背景音乐,然后合成一个高清短视频或横版长视频。
关键词: MoneyPrinterTurbo 本地化 / Ollama 视频生成 / VoxCPM2 配音 / 中文短视频自动化 / Pexels 素材匹配 / B站 YouTube 素材下载 / AI 视频本地部署
由于该项目的 部署 和 使用,对于一些小白用户来说,还是 有一定的门槛,在此特别感谢
录咖(AI智能 多媒体服务平台) 网站基于该项目,提供的免费AI视频生成器服务,可以不用部署,直接在线使用,非常方便。
感谢佐糖 https://picwish.cn 对该项目的支持和赞助,使得该项目能够持续的更新和维护。
佐糖专注于图像处理领域,提供丰富的图像处理工具,将复杂操作极致简化,真正实现让图像处理更简单。
详细差异见:MoneyPrinterTurbo-LocalCN 与原版差异
-
本地优先:默认面向
Ollama + VoxCPM2的本地生成链路,减少对云端 TTS/LLM 的依赖。 -
VoxCPM2 音色描述配音:支持用中文音色描述选择旁白风格,更适合中文教程、口播、生活方式、知识科普视频。
-
文案驱动素材匹配:LLM 生成素材关键词时会按文案顺序抽取具体镜头,配合顺序拼接,让画面更贴旁白。
-
亚洲/中国面孔偏好:Pexels/Pixabay/社交平台搜索会优先叠加 Asian/Chinese 人物检索词,更适合中文内容场景。
-
真人/动画风格选择:可在 WebUI 里选择真人实拍或动画/卡通素材风格;Pixabay 动画模式会使用 animation 类型。
-
横版长视频支持增强:WebUI 明确支持横屏
16:9,适合 B站、YouTube、西瓜视频等长视频平台。 -
字幕可关闭:可一键生成无字幕视频,适合后期二剪或平台内字幕。
-
社交平台素材发现与下载:集成 yt-dlp,可从 YouTube/B站/TikTok/抖音链接或搜索结果下载公开视频素材后作为本地素材使用。
-
显存保护:使用本地 VoxCPM2 时自动降低并发和渲染线程,减少 LLM/TTS/Whisper 同时运行造成的 OOM。
-
一键本地启动包适配:面向 Windows 便携包,提供本地 Ollama/VoxCPM2/WebUI 的启动与健康检查辅助脚本。
-
完整的 MVC架构,代码 结构清晰,易于维护,支持
API和Web界面 -
支持视频文案 AI自动生成,也可以自定义文案
-
支持多种 高清视频 尺寸
- 竖屏 9:16,
1080x1920 - 横屏 16:9,
1920x1080
- 竖屏 9:16,
-
支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的
-
支持 视频片段时长 设置,方便调节素材切换频率
-
支持 中文 和 英文 视频文案
-
支持 多种语音 合成,可 实时试听 效果
-
支持 字幕生成,可以调整
字体、位置、颜色、大小,同时支持字幕描边设置 -
支持 背景音乐,随机或者指定音乐文件,可设置
背景音乐音量 -
视频素材来源 高清,而且 无版权,也可以使用自己的 本地素材
-
支持 OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、 DeepSeek、 文心一言 等多种模型接入
- 中国用户建议使用 DeepSeek 或 Moonshot 作为大模型提供商(国内可直接访问,不需要VPN。注册就送额度,基本够用)
- GPT-SoVITS 配音支持
- 优化语音合成,利用大模型,使其合成的声音,更加自然,情绪更加丰富
- 增加视频转场效果,使其看起来更加的流畅
- 增加更多视频素材来源,优化视频素材和文案的匹配度
- 增加视频长度选项:短、中、长
- 支持更多的语音合成服务商,比如 OpenAI TTS
- 自动上传到YouTube平台
更真实的合成声音 |
||
|---|---|---|
demo-portrait-1.mp4 |
default.mp4 |
demo-portrait-2.mp4 |
demo-landscape.mp4 |
demo-landscape-2.mp4 |
- 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
- Windows 10 或 MacOS 11.0 以上系统
下载一键启动包,解压直接使用(路径不要有 中文、特殊字符、空格)
- 百度网盘(1.2.1 老版本): https://pan.baidu.com/s/1pSNjxTYiVENulTLm6zieMQ?pwd=g36q 提取码: g36q
下载后,建议先双击执行 update.bat 更新到最新代码,然后双击 start.bat 启动
启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)
- 尽量不要使用 中文路径,避免出现一些无法预料的问题
- 请确保你的 网络 是正常的,VPN需要打开
全局流量模式
git clone https://github.com/harry0703/MoneyPrinterTurbo.git- 将
config.example.toml文件复制一份,命名为config.toml - 按照
config.toml文件中的说明,配置好pexels_api_keys和llm_provider,并根据 llm_provider 对应的服务商,配置相关的 API Key
如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/
如果是Windows系统,请参考微软的文档:
- https://learn.microsoft.com/zh-cn/windows/wsl/install
- https://learn.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-containers
cd MoneyPrinterTurbo
docker-compose up注意:最新版的docker安装时会自动以插件的形式安装docker compose,启动命令调整为docker compose up
打开浏览器,访问 http://0.0.0.0:8501
打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc
视频教程
- 完整的使用演示:https://v.douyin.com/iFhnwsKY/
- 如何在Windows上部署:https://v.douyin.com/iFyjoW3M
建议使用 pdm
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
pdm sync-
Windows:
- 下载 https://imagemagick.org/script/download.php 选择Windows版本,切记一定要选择 静态库 版本,比如 ImageMagick-7.1.1-32-Q16-x64-static.exe
- 安装下载好的 ImageMagick,注意不要修改安装路径
- 修改
配置文件 config.toml中的imagemagick_path为你的 实际安装路径
-
MacOS:
brew install imagemagick
-
Ubuntu
sudo apt-get install imagemagick
-
CentOS
sudo yum install ImageMagick
注意需要到 MoneyPrinterTurbo 项目 根目录 下执行以下命令
webui.batsh webui.sh启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)
python main.py启动后,可以查看 API文档 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。
所有支持的声音列表,可以查看:声音列表
2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。
当前支持2种字幕生成方式:
- edge: 生成
速度快,性能更好,对电脑配置没有要求,但是质量可能不稳定 - whisper: 生成
速度慢,性能较差,对电脑配置有一定要求,但是质量更可靠。
可以修改 config.toml 配置文件中的 subtitle_provider 进行切换
建议使用 edge 模式,如果生成的字幕质量不好,再切换到 whisper 模式
注意:
- whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
- 如果留空,表示不生成字幕。
由于国内无法访问 HuggingFace,可以使用以下方法下载
whisper-large-v3的模型文件
下载地址:
- 百度网盘: https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9
- 夸克网盘:https://pan.quark.cn/s/3ee3d991d64b
模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models 里面,
最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
用于视频的背景音乐,位于项目的 resource/songs 目录下。
当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。
用于视频字幕的渲染,位于项目的 resource/fonts 目录下,你也可以放进去自己的字体。
通常情况下,ffmpeg 会被自动下载,并且会被自动检测到。 但是如果你的环境有问题,无法自动下载,可能会遇到如下错误:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
此时你可以从 https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg,解压后,设置 ffmpeg_path 为你的实际安装路径即可。
[app]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \\
ffmpeg_path = "C:\\Users\\harry\\Downloads\\ffmpeg.exe"可以在ImageMagick的配置文件policy.xml中找到这些策略。
这个文件通常位于 /etc/ImageMagick-X/ 或 ImageMagick 安装目录的类似位置。
修改包含pattern="@"的条目,将rights="none"更改为rights="read|write"以允许对文件的读写操作。
这个问题是由于系统打开文件数限制导致的,可以通过修改系统的文件打开数限制来解决。
查看当前限制
ulimit -n如果过低,可以调高一些,比如
ulimit -n 10240LocalEntryNotfoundEror: Cannot find an appropriate cached snapshotfolderfor the specified revision on the local disk and outgoing trafic has been disabled. To enablerepo look-ups and downloads online, pass 'local files only=False' as input.
或者
An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub: An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the specified revision on the local disk. Please check your internet connection and try again. Trying to load the model directly from the local cache, if it exists.
解决方法:点击查看如何从网盘手动下载模型
- 可以提交 issue 或者 pull request。
该项目基于 https://github.com/FujiwaraChoki/MoneyPrinter 重构而来,做了大量的优化,增加了更多的功能。 感谢原作者的开源精神。
点击查看 LICENSE 文件



