Proyek ini melakukan analisis sentimen secara otomatis dari rekaman wawancara berbahasa Indonesia. Sistem ini dapat:
- Mentranskripsikan audio wawancara (format .ogg, .mp3, dll) menjadi teks
- Menganalisis sentimen dari teks transkripsi
- Mengekstrak kata kunci penting
- Membuat visualisasi hasil analisis (word cloud dan distribusi sentimen)
- Transkripsi Audio: Menggunakan model Whisper OpenAI untuk konversi audio ke teks
- Analisis Sentimen: Menggunakan model RoBERTa khusus bahasa Indonesia
- Ekstraksi Kata Kunci: Menggunakan TF-IDF dengan stopwords bahasa Indonesia
- Word Cloud: Visualisasi kata-kata penting dalam wawancara
- Visualisasi Sentimen: Distribusi sentimen dalam bentuk grafik batang
- Export Otomatis: Menyimpan hasil dalam format CSV dan gambar
Program akan menghasilkan file-file berikut:
| file | Direktori | Deskripsi |
|---|---|---|
transkrip.txt |
data/ |
Teks hasil transkripsi audio wawancara |
keywords.csv |
data/ |
Kata kunci penting dari teks |
processed_reviews.csv |
data/ |
Teks yang telah diproses (cleaned) |
wordcloud.png |
plots/ |
Visualisasi word cloud dari teks |
sentiment_distribution.png |
plots/ |
Grafik distribusi sentimen |
transkrip_audio(file_path): Transkripsi file audiosave_transcription(): Menyimpan hasil transkripsi ke file
preprocess_text(): Membersihkan dan memproses tekslabel_sentiment(): Menganalisis sentimen teksextract_keywords(): Mengekstrak kata kunci pentinggenerate_wordcloud(): Membuat visualisasi word cloudplot_sentiment_distribution(): Membuat grafik distribusi sentimen
- Pengguna mengunggah file audio wawancara.
- Sistem melakukan transkripsi audio ke teks.
- Teks hasil transkripsi diproses untuk analisis lebih lanjut.
- Sistem menganalisis sentimen dari teks.
- Kata kunci penting diekstrak dari teks.
- Visualisasi hasil analisis dibuat (word cloud dan distribusi sentimen).
- Hasil akhir disimpan dalam format yang ditentukan.