AI Hubμμ μ 곡λλ KsponSpeech Open Data μ μ²λ¦¬λ₯Ό μ§ννλ νλ‘μ νΈ
- Nvidia Jasper Model μ νμ΅ λ°μ΄ν°μ format νν
- Clova Call Model μ νμ΅ λ°μ΄ν°μ format νν
- csv
- json
- os
- natsort
AI Hubμμ μ 곡λλ KsponDatasetκ³Ό κ°μ΄ μμλ³ μ€ν¬λ¦½νΈκ° pair λ‘ μ μλμ΄μλ ννμμ text scriptμ filepathλ§ λͺ¨λ κ°μ Έμμ 리μ€νΈμ λ΄λ ν¨μ natsort λΌμ΄λΈλ¬λ¦¬λ₯Ό ν΅ν΄ ν΄λΉ νμΌλ€μ μ€λ¦μ°¨μμΌλ‘ μ λ ¬
- input_dir : μ΄λ€ λλ ν 리μμ νμΌλ€μ μ°Ύμκ²μΈμ§μ λν μμ λλ ν 리 κ²½λ‘
- file_extension : μ΄λ€ νμ₯μλ₯Ό κ°μ§ νμΌμ 리μ€νΈν μν¬κ²μΈμ§μ λν νμ₯μ (default : txt)
Github Open Source μ€ clovaaiμ ClocaCall modelμ νμ΅λ°μ΄ν°μ μ λ§λ ννλ‘ μ μνκΈ° μν ν¨μ
ClovaCall.json
[
{
"wav" : "42_0603_748_0_03319_00.wav",
"text : "λ¨μ²΄ ν μΈμ΄ κ°λ₯ν μκ°λκ° λ°λ‘ μλμ?",
"speaker_id" : "03319"
},
...,
{
"wav" : "42_0610_778_0_03607_01.wav",
"text" : "μ κΈ°λ€μ΄ λλ§ν λμ΄λ°©μ΄ λ°λ‘ μλμ?",
"speaker_id" : "03607"
}
]