Skip to content

terryuuang/Text2Video-ForkyEdition

Repository files navigation

Text2Video-ForkyEdition 💸

Stargazers Issues Forks License

📢 關於此專案

本專案基於 harry0703/MoneyPrinterTurbo 進行 Fork 開發

主要改進:

    🌏 完整繁體中文化 - 介面與文件全面繁體中文化 🔧 問題修正 - 修復原版本中的已知問題 ✨ 功能優化 - 針對繁體中文使用者體驗進行優化

terryuuang%2FMoneyPrinterTurbo | Trendshift

只需提供一個影片 主題關鍵字 ,就可以全自動產生影片文案、影片素材、影片字幕、影片背景音樂,然後合成一個高畫質的短影片。

影片示範 📺

直式 9:16

▶️ 《如何增加生活的樂趣》 ▶️ 《金錢的作用》
更真實的合成聲音
▶️ 《生命的意義是什麼》
demo-portrait-1.mp4
default.mp4
demo-portrait-2.mp4

橫式 16:9

▶️《生命的意義是什麼》 ▶️《為什麼要運動》
demo-landscape.mp4
demo-landscape-2.mp4

配置要求 📦

  • 建議最低 CPU 4核 或以上,記憶體 4G 或以上,顯卡非必須
  • Windows 10 或 MacOS 11.0 以上系統

快速開始 🚀

在 Google Colab 中執行

免去本機環境配置,點擊直接在 Google Colab 中快速體驗 Text2Video-ForkyEdition

Open in Colab

安裝部署 📥

前提條件

  • 儘量不要使用 中文路徑,避免出現一些無法預料的問題
  • 請確保你的 網路 是正常的,VPN需要開啟全域流量模式

① 複製程式碼

git clone https://github.com/terryuuang/Text2Video-ForkyEdition.git

② 修改配置檔案(可選,建議啟動後也可以在 WebUI 裡面配置)

  • config.example.toml 檔案複製一份,命名為 config.toml
  • 按照 config.toml 檔案中的說明,配置好 pexels_api_keysllm_provider,並根據 llm_provider 對應的服務商,配置相關的 API Key

手動部署 📦

① 建立虛擬環境

git clone https://github.com/terryuuang/Text2Video-ForkyEdition.git
cd Text2Video-ForkyEdition
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

② 安裝好 ImageMagick

  • Windows:

    • 下載 https://imagemagick.org/script/download.php 選擇Windows版本,切記一定要選擇 靜態庫 版本,比如 ImageMagick-7.1.1-32-Q16-x64-static.exe
    • 安裝下載好的 ImageMagick,注意不要修改安裝路徑
    • 修改 配置檔案 config.toml 中的 imagemagick_path 為你的 實際安裝路徑
  • MacOS:

    brew install imagemagick
  • Ubuntu

    sudo apt-get install imagemagick
  • CentOS

    sudo yum install ImageMagick

③ 啟動Web介面 🌐

注意需要到 Text2Video-ForkyEdition 專案 根目錄 下執行以下指令

Windows
webui.bat
MacOS or Linux
sh webui.sh

啟動後,會自動開啟瀏覽器(如果開啟是空白,建議換成 Chrome 或者 Edge 開啟)

④ 啟動API服務 🚀

python main.py

啟動後,可以查看 API文件 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接線上偵錯介面,快速體驗。

語音合成 🗣

所有支援的聲音清單,可以查看:聲音清單

2024-04-16 v1.1.2 新增了9種Azure的語音合成聲音,需要配置API KEY,該聲音合成的更加真實。

字幕產生 📜

目前支援2種字幕產生方式:

  • edge: 產生速度快,效能更好,對電腦配置沒有要求,但是品質可能不穩定
  • whisper: 產生速度慢,效能較差,對電腦配置有一定要求,但是品質更可靠

可以修改 config.toml 配置檔案中的 subtitle_provider 進行切換

建議使用 edge 模式,如果產生的字幕品質不好,再切換到 whisper 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下載一個模型檔案,大約 3GB 左右,請確保網路通暢
  2. 如果留空,表示不產生字幕。

由於國內無法存取 HuggingFace,可以使用以下方法下載 whisper-large-v3 的模型檔案

下載位址:

模型下載後解壓縮,整個目錄放到 .\Text2Video-ForkyEdition\models 裡面, 最終的檔案路徑應該是這樣: .\Text2Video-ForkyEdition\models\whisper-large-v3

Text2Video-ForkyEdition
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json

背景音樂 🎵

用於影片的背景音樂,位於專案的 resource/songs 目錄下。

目前專案裡面放了一些預設的音樂,來自於 YouTube 影片,如有侵權,請刪除。

字幕字型 🅰

用於影片字幕的渲染,位於專案的 resource/fonts 目錄下,你也可以放進去自己的字型。

常見問題 🤔

❓RuntimeError: No ffmpeg exe could be found

通常情況下,ffmpeg 會被自動下載,並且會被自動檢測到。 但是如果你的環境有問題,無法自動下載,可能會遇到如下錯誤:

RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.

此時你可以從 https://www.gyan.dev/ffmpeg/builds/ 下載ffmpeg,解壓縮後,設定 ffmpeg_path 為你的實際安裝路徑即可。

[app]
# 請根據你的實際路徑設定,注意 Windows 路徑分隔符為 \\
ffmpeg_path = "C:\\Users\\harry\\Downloads\\ffmpeg.exe"

❓ImageMagick的安全性原則阻止了與暫存檔案@/tmp/tmpur5hyyto.txt相關的操作

可以在ImageMagick的配置檔案policy.xml中找到這些原則。 這個檔案通常位於 /etc/ImageMagick-X/ 或 ImageMagick 安裝目錄的類似位置。 修改包含pattern="@"的條目,將rights="none"更改為rights="read|write"以允許對檔案的讀寫操作。

❓OSError: [Errno 24] Too many open files

這個問題是由於系統開啟檔案數限制導致的,可以透過修改系統的檔案開啟數限制來解決。

查看目前限制

ulimit -n

如果過低,可以調高一些,比如

ulimit -n 10240

更新記錄 📝

繁體中文版本更新

  • 🌏 完整繁體中文化 - 將原專案的簡體中文內容全面轉換為繁體中文
  • 🔧 問題修正 - 修復原版本在中文環境下的編碼問題
  • 📝 文件翻譯 - 完整翻譯使用說明文件和錯誤訊息
  • 介面優化 - 針對繁體中文使用者進行介面調整

基於原專案

  • 本專案基於 harry0703/MoneyPrinterTurbo v1.2.6 版本
  • 保持與原專案功能的完整相容性
  • 定期同步原專案的新功能更新

意見回饋 📢

授權條款 📝

點擊查看 LICENSE 檔案

About

本專案基於 harry0703/MoneyPrinterTurbo 進行 Fork 開發

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors