AI-Driven Transcription & Diarization Tool for Twitch VODs

This project provides GPU-accelerated transcription and speaker diarization for audio/video files, with a focus on processing Twitch VODs.

Requirements

Python 3.9+
NVIDIA GPU with CUDA support (optional but recommended)
FFmpeg (for pydub)

Installation

pip install -r requirements.txt

Usage

python main.py <input_file.mp4> -m base -o transcript.json

Modules

transcribe.py: Uses OpenAI Whisper for transcription.
diarize.py: Uses pyannote.audio for speaker diarization.
silence_detect.py: Uses pydub to detect silences.
main.py: Orchestrates the pipeline and outputs JSON.

Output Format

Each segment in the output JSON includes:

start: float (seconds) segmentation start time
end: float (seconds) segmentation end time
text: string transcript text
speaker: speaker label (e.g., 'Speaker 1')

Testing

Run unit tests with:

pytest

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.windsurf/rules		.windsurf/rules
cdk		cdk
test		test
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
conftest.py		conftest.py
diarize.py		diarize.py
docker-requirements.txt		docker-requirements.txt
extract_audio.py		extract_audio.py
main.py		main.py
parallel-output.json		parallel-output.json
parallel.py		parallel.py
requirements.txt		requirements.txt
run_local.py		run_local.py
silence_detect.py		silence_detect.py
test-output.json		test-output.json
transcribe.py		transcribe.py
transcript_1h49m-1h59m.json		transcript_1h49m-1h59m.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI-Driven Transcription & Diarization Tool for Twitch VODs

Requirements

Installation

Usage

Modules

Output Format

Testing

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AI-Driven Transcription & Diarization Tool for Twitch VODs

Requirements

Installation

Usage

Modules

Output Format

Testing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages