Terminálový Python program, který přepisuje audio nebo video soubory do češtiny pomocí OpenAI Whisper.
- Přepis audio/video souborů (.mp3, .wav, .mp4, atd.)
- Výstup obsahuje časové značky
- Volba modelu (tiny, base, small, medium, large)
- Výstupní soubor dle zadání
- Není potřeba GUI ani složité prostředí
- macOS
/usr/bin/python3(systémový Python – doporučený)ffmpeg(nainstalovaný např. pomocíbrew install ffmpeg)
/usr/bin/python3 -m pip install --upgrade pip --user
/usr/bin/python3 -m pip install torch --user
/usr/bin/python3 -m pip install git+https://github.com/openai/whisper.git --user
/usr/bin/python3 -m pip install ffmpeg-python --user/usr/bin/python3 prepis.py vstupni_soubor.mp4 -m medium -o prepis.txtvstupni_soubor.mp4– cesta k audio/video souboru-m medium– Whisper model (tiny,small,medium,large)-o prepis.txt– výstupní soubor
/usr/bin/python3 prepis.py➡ Program se tě zeptá na cestu k souboru.
Ukázka výstupu:
[0:00:00 - 0:00:07] Dobrý den, vítám vás na dnešní poradě.
[0:00:07 - 0:00:14] Dnes budeme probírat průběh projektu X.
Např. jen prvních 10 minut:
ffmpeg -i schuzka.mp4 -t 00:10:00 vystup_10min.mp4tiny: velmi rychlý, méně přesnýmedium: dobrý kompromis (doporučeno)large: velmi přesný, ale velmi pomalý bez GPU