本專案基於 harry0703/MoneyPrinterTurbo 進行 Fork 開發
主要改進:
-
🌏 完整繁體中文化 - 介面與文件全面繁體中文化
🔧 問題修正 - 修復原版本中的已知問題
✨ 功能優化 - 針對繁體中文使用者體驗進行優化
只需提供一個影片 主題 或 關鍵字 ,就可以全自動產生影片文案、影片素材、影片字幕、影片背景音樂,然後合成一個高畫質的短影片。
更真實的合成聲音 |
||
|---|---|---|
demo-portrait-1.mp4 |
default.mp4 |
demo-portrait-2.mp4 |
demo-landscape.mp4 |
demo-landscape-2.mp4 |
- 建議最低 CPU 4核 或以上,記憶體 4G 或以上,顯卡非必須
- Windows 10 或 MacOS 11.0 以上系統
免去本機環境配置,點擊直接在 Google Colab 中快速體驗 Text2Video-ForkyEdition
- 儘量不要使用 中文路徑,避免出現一些無法預料的問題
- 請確保你的 網路 是正常的,VPN需要開啟
全域流量模式
git clone https://github.com/terryuuang/Text2Video-ForkyEdition.git- 將
config.example.toml檔案複製一份,命名為config.toml - 按照
config.toml檔案中的說明,配置好pexels_api_keys和llm_provider,並根據 llm_provider 對應的服務商,配置相關的 API Key
git clone https://github.com/terryuuang/Text2Video-ForkyEdition.git
cd Text2Video-ForkyEdition
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt-
Windows:
- 下載 https://imagemagick.org/script/download.php 選擇Windows版本,切記一定要選擇 靜態庫 版本,比如 ImageMagick-7.1.1-32-Q16-x64-static.exe
- 安裝下載好的 ImageMagick,注意不要修改安裝路徑
- 修改
配置檔案 config.toml中的imagemagick_path為你的 實際安裝路徑
-
MacOS:
brew install imagemagick
-
Ubuntu
sudo apt-get install imagemagick
-
CentOS
sudo yum install ImageMagick
注意需要到 Text2Video-ForkyEdition 專案 根目錄 下執行以下指令
webui.batsh webui.sh啟動後,會自動開啟瀏覽器(如果開啟是空白,建議換成 Chrome 或者 Edge 開啟)
python main.py啟動後,可以查看 API文件 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接線上偵錯介面,快速體驗。
所有支援的聲音清單,可以查看:聲音清單
2024-04-16 v1.1.2 新增了9種Azure的語音合成聲音,需要配置API KEY,該聲音合成的更加真實。
目前支援2種字幕產生方式:
- edge: 產生
速度快,效能更好,對電腦配置沒有要求,但是品質可能不穩定 - whisper: 產生
速度慢,效能較差,對電腦配置有一定要求,但是品質更可靠。
可以修改 config.toml 配置檔案中的 subtitle_provider 進行切換
建議使用 edge 模式,如果產生的字幕品質不好,再切換到 whisper 模式
注意:
- whisper 模式下需要到 HuggingFace 下載一個模型檔案,大約 3GB 左右,請確保網路通暢
- 如果留空,表示不產生字幕。
由於國內無法存取 HuggingFace,可以使用以下方法下載
whisper-large-v3的模型檔案
下載位址:
- 百度網盤: https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9
- 夸克網盤:https://pan.quark.cn/s/3ee3d991d64b
模型下載後解壓縮,整個目錄放到 .\Text2Video-ForkyEdition\models 裡面,
最終的檔案路徑應該是這樣: .\Text2Video-ForkyEdition\models\whisper-large-v3
Text2Video-ForkyEdition
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
用於影片的背景音樂,位於專案的 resource/songs 目錄下。
目前專案裡面放了一些預設的音樂,來自於 YouTube 影片,如有侵權,請刪除。
用於影片字幕的渲染,位於專案的 resource/fonts 目錄下,你也可以放進去自己的字型。
通常情況下,ffmpeg 會被自動下載,並且會被自動檢測到。 但是如果你的環境有問題,無法自動下載,可能會遇到如下錯誤:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
此時你可以從 https://www.gyan.dev/ffmpeg/builds/ 下載ffmpeg,解壓縮後,設定 ffmpeg_path 為你的實際安裝路徑即可。
[app]
# 請根據你的實際路徑設定,注意 Windows 路徑分隔符為 \\
ffmpeg_path = "C:\\Users\\harry\\Downloads\\ffmpeg.exe"可以在ImageMagick的配置檔案policy.xml中找到這些原則。
這個檔案通常位於 /etc/ImageMagick-X/ 或 ImageMagick 安裝目錄的類似位置。
修改包含pattern="@"的條目,將rights="none"更改為rights="read|write"以允許對檔案的讀寫操作。
這個問題是由於系統開啟檔案數限制導致的,可以透過修改系統的檔案開啟數限制來解決。
查看目前限制
ulimit -n如果過低,可以調高一些,比如
ulimit -n 10240- 🌏 完整繁體中文化 - 將原專案的簡體中文內容全面轉換為繁體中文
- 🔧 問題修正 - 修復原版本在中文環境下的編碼問題
- 📝 文件翻譯 - 完整翻譯使用說明文件和錯誤訊息
- ✨ 介面優化 - 針對繁體中文使用者進行介面調整
- 本專案基於 harry0703/MoneyPrinterTurbo v1.2.6 版本
- 保持與原專案功能的完整相容性
- 定期同步原專案的新功能更新
- 可以提交 issue 或者 pull request。
點擊查看 LICENSE 檔案