Projektübersicht (Jetzt die Online-Version ausprobieren!)
Klic Studio ist eine umfassende Audio- und Video-Lokalisierungs- und Verbesserungslösung, die von Krillin AI entwickelt wurde. Dieses minimalistische und leistungsstarke Tool vereint Videoübersetzung, Synchronisation und Sprachklonung und unterstützt sowohl Quer- als auch Hochformat-Ausgaben, um auf allen gängigen Plattformen (Bilibili, Xiaohongshu, Douyin, Video-Nummer, Kuaishou, YouTube, TikTok usw.) perfekt präsentiert zu werden. Mit einem End-to-End-Workflow können Sie mit nur wenigen Klicks Rohmaterial in ansprechende, plattformübergreifende Inhalte umwandeln.
🎯 Ein-Klick-Start: Keine komplexe Umgebungskonfiguration erforderlich, automatische Installation von Abhängigkeiten, sofort einsatzbereit, neue Desktop-Version für mehr Benutzerfreundlichkeit!
📥 Videoerfassung: Unterstützt yt-dlp-Downloads oder lokale Datei-Uploads
📜 Präzise Erkennung: Hochgenaue Spracherkennung basierend auf Whisper
🧠 Intelligente Segmentierung: Verwendung von LLM zur Untertitelsegmentierung und -ausrichtung
🔄 Terminologieersetzung: Ein-Klick-Ersetzung von Fachbegriffen
🌍 Professionelle Übersetzung: LLM-Übersetzung mit Kontext für natürliche Semantik
🎙️ Synchronisationsklon: Bietet ausgewählte Stimmen von CosyVoice oder benutzerdefinierte Stimmklonung
🎬 Videokomposition: Automatische Verarbeitung von Quer- und Hochformatvideos sowie Untertitel-Layout
💻 Plattformübergreifend: Unterstützt Windows, Linux, macOS, bietet Desktop- und Server-Versionen
Das folgende Bild zeigt die Ergebnisse eines 46-minütigen lokal importierten Videos, das nach einem Ein-Klick-Vorgang generierte Untertiteldateien ohne manuelle Anpassungen enthält. Keine Auslassungen, Überlappungen, natürliche Satztrennung und die Übersetzungsqualität ist ebenfalls sehr hoch.

subtitle_translation.mp4 |
tts.mp4 |
agi.mp4 |
Alle lokalen Modelle in der folgenden Tabelle unterstützen die automatische Installation von ausführbaren Dateien + Modell-Dateien. Sie müssen nur auswählen, der Rest wird von Klic für Sie vorbereitet.
| Dienstquelle | Unterstützte Plattformen | Modelloptionen | Lokal/Cloud | Anmerkungen |
|---|---|---|---|---|
| OpenAI Whisper | Alle Plattformen | - | Cloud | Schnell und effektiv |
| FasterWhisper | Windows/Linux | tiny/medium/large-v2 (empfohlen: medium+) |
Lokal | Noch schneller, keine Cloud-Service-Kosten |
| WhisperKit | macOS (nur M-Serie Chips) | large-v2 |
Lokal | Native Optimierung für Apple-Chips |
| WhisperCpp | Alle Plattformen | large-v2 |
Lokal | Unterstützt alle Plattformen |
| Alibaba Cloud ASR | Alle Plattformen | - | Cloud | Vermeidung von Netzwerkproblemen in Festland-China |
✅ Kompatibel mit allen Cloud-/lokalen großen Sprachmodell-Diensten, die den OpenAI API-Spezifikationen entsprechen, einschließlich, aber nicht beschränkt auf:
- OpenAI
- Gemini
- DeepSeek
- Tongyi Qianwen
- Lokal bereitgestellte Open-Source-Modelle
- Andere API-Dienste, die mit OpenAI-Format kompatibel sind
- Alibaba Cloud Sprachdienst
- OpenAI TTS
Eingabesprachen: Chinesisch, Englisch, Japanisch, Deutsch, Türkisch, Koreanisch, Russisch, Malaiisch (wird kontinuierlich erweitert)
Übersetzungssprachen: Englisch, Chinesisch, Russisch, Spanisch, Französisch und weitere 101 Sprachen
Laden Sie zunächst die ausführbare Datei herunter, die mit Ihrem Betriebssystem im Release übereinstimmt. Wählen Sie dann je nach Anleitung die Desktop- oder Nicht-Desktop-Version aus und legen Sie sie in einen leeren Ordner. Laden Sie die Software in einen leeren Ordner herunter, da nach dem Ausführen einige Verzeichnisse erstellt werden, die so besser verwaltet werden können.
【Wenn es sich um die Desktop-Version handelt, d.h. die Release-Datei mit "desktop" versehen ist, lesen Sie hier】
Die Desktop-Version ist neu veröffentlicht worden, um das Problem zu lösen, dass neue Benutzer Schwierigkeiten haben, die Konfigurationsdateien korrekt zu bearbeiten. Es gibt einige Bugs, die kontinuierlich aktualisiert werden.
- Doppelklicken Sie auf die Datei, um zu beginnen (auch die Desktop-Version muss konfiguriert werden, dies erfolgt innerhalb der Software)
【Wenn es sich um die Nicht-Desktop-Version handelt, d.h. die Release-Datei ohne "desktop", lesen Sie hier】
Die Nicht-Desktop-Version ist die ursprüngliche Version, die Konfiguration ist komplexer, aber die Funktionen sind stabil und sie eignet sich gut für die Serverbereitstellung, da sie die Benutzeroberfläche webbasiert bereitstellt.
- Erstellen Sie im Ordner einen
config-Ordner und erstellen Sie dann imconfig-Ordner eineconfig.toml-Datei. Kopieren Sie den Inhalt derconfig-example.toml-Datei im Quellcodeverzeichnisconfigin dieconfig.tomlund füllen Sie Ihre Konfigurationsinformationen gemäß den Kommentaren aus. - Doppelklicken Sie oder führen Sie die ausführbare Datei im Terminal aus, um den Dienst zu starten
- Öffnen Sie den Browser und geben Sie
http://127.0.0.1:8888ein, um zu beginnen (ersetzen Sie 8888 durch den Port, den Sie in der Konfigurationsdatei angegeben haben)
【Wenn es sich um die Desktop-Version handelt, d.h. die Release-Datei mit "desktop" versehen ist, lesen Sie hier】
Aufgrund von Problemen mit der Signierung kann die Desktop-Version derzeit nicht durch Doppelklicken oder DMG-Installation direkt ausgeführt werden. Sie müssen die Anwendung manuell vertrauen. Die Methode ist wie folgt:
- Öffnen Sie das Verzeichnis, in dem sich die ausführbare Datei (angenommen, der Dateiname ist KlicStudio_1.0.0_desktop_macOS_arm64) befindet, im Terminal
- Führen Sie nacheinander die folgenden Befehle aus:
sudo xattr -cr ./KlicStudio_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KlicStudio_1.0.0_desktop_macOS_arm64
./KlicStudio_1.0.0_desktop_macOS_arm64
【Wenn es sich um die Nicht-Desktop-Version handelt, d.h. die Release-Datei ohne "desktop", lesen Sie hier】
Diese Software hat keine Signierung, daher müssen Sie beim Ausführen unter macOS nach Abschluss der Datei-Konfiguration in den "Grundlegenden Schritten" die Anwendung manuell vertrauen. Die Methode ist wie folgt:
- Öffnen Sie das Verzeichnis, in dem sich die ausführbare Datei (angenommen, der Dateiname ist KlicStudio_1.0.0_macOS_arm64) befindet, im Terminal
- Führen Sie nacheinander die folgenden Befehle aus:
um den Dienst zu starten
sudo xattr -rd com.apple.quarantine ./KlicStudio_1.0.0_macOS_arm64 sudo chmod +x ./KlicStudio_1.0.0_macOS_arm64 ./KlicStudio_1.0.0_macOS_arm64
Dieses Projekt unterstützt die Docker-Bereitstellung. Bitte beachten Sie die Docker-Bereitstellungsanleitung
Wenn Sie auf Probleme beim Herunterladen von Videos stoßen
Bitte beachten Sie die Cookie-Konfigurationsanleitung, um Ihre Cookie-Informationen zu konfigurieren.
Die schnellste und einfachste Konfigurationsmethode:
- Füllen Sie
transcribe.provider.namemitopenai, dann müssen Sie nur den Blocktranscribe.openaisowie die Konfiguration des großen Modells im Blockllmausfüllen, um die Untertitelübersetzung durchzuführen. (app.proxy,modelundopenai.base_urlkönnen je nach Bedarf ausgefüllt werden)
Verwendung der Konfiguration für lokale Spracherkennungsmodelle (eine Auswahl, die Kosten, Geschwindigkeit und Qualität berücksichtigt)
- Füllen Sie
transcribe.provider.namemitfasterwhisper,transcribe.fasterwhisper.modelmitlarge-v2, und füllen Sie dann den Blockllmmit der Konfiguration des großen Modells aus, um die Untertitelübersetzung durchzuführen. Das lokale Modell wird automatisch heruntergeladen und installiert. (app.proxyundopenai.base_urlwie oben)
Text-zu-Sprache (TTS) ist optional, die Konfigurationslogik ist die gleiche wie oben, füllen Sie tts.provider.name aus und dann die entsprechenden Konfigurationsblöcke unter tts. Die Stimmencodes im UI sollten gemäß der Dokumentation des gewählten Anbieters ausgefüllt werden (die Dokumentationsadressen finden Sie im Abschnitt häufige Fragen weiter unten). Das Ausfüllen von Alibaba Cloud's aksk usw. kann sich wiederholen, um die Struktur der Konfiguration klar zu halten.
Hinweis: Bei der Verwendung von Stimmklonung unterstützt tts nur die Auswahl von aliyun.
Für den Erhalt von Alibaba Cloud AccessKey, Bucket, AppKey lesen Sie bitte: Alibaba Cloud Konfigurationsanleitung
Bitte verstehen Sie, dass die Aufgabe = Spracherkennung + großes Modellübersetzung + Sprachdienst (TTS usw., optional) ist, was Ihnen beim Verständnis der Konfigurationsdatei sehr helfen wird.
Bitte besuchen Sie die Häufigen Fragen
- Reichen Sie keine unnötigen Dateien wie .vscode, .idea usw. ein, verwenden Sie .gitignore zur Filterung
- Reichen Sie nicht config.toml ein, sondern verwenden Sie config-example.toml zur Einreichung
- Treten Sie unserer QQ-Gruppe bei, um Fragen zu klären: 754069680
- Folgen Sie unseren Social-Media-Konten, Bilibili, wo wir täglich hochwertige Inhalte im Bereich AI-Technologie teilen

