Skip to content

Latest commit

Β 

History

History
117 lines (74 loc) Β· 5.03 KB

File metadata and controls

117 lines (74 loc) Β· 5.03 KB

πŸŽ™οΈ LectureVoice

πŸ“š Purpose: Automatic lecture video commentary application

πŸ‘₯ Target Audience: Visually impaired students

LectureVoiceλŠ” μ‹œκ° μž₯μ•  학생듀이 κ°•μ˜ μ˜μƒμ„ 보닀 μ‰½κ²Œ 이해할 수 μžˆλ„λ‘ μŒμ„± 해섀을 μžλ™μœΌλ‘œ μƒμ„±ν•˜μ—¬ μ œκ³΅ν•˜λŠ” λͺ¨λ°”일 μ• ν”Œλ¦¬μΌ€μ΄μ…˜μž…λ‹ˆλ‹€.

🌟 μ£Όμš” κΈ°λŠ₯

  • λΉ„λ””μ˜€ 뢄석 및 ν•΄μ„€ 생성
    • κ°•μ˜ μ˜μƒμ˜ λ‹€μ΄μ–΄κ·Έλž¨κ³Ό ν…μŠ€νŠΈλ₯Ό μΈμ‹ν•˜κ³ , μƒμ„Έν•œ μ˜€λ””μ˜€ 해섀을 μ œκ³΅ν•©λ‹ˆλ‹€.
  • ν”Œλž«νΌ
    • λͺ¨λ°”일 κΈ°κΈ°μ—μ„œ μ‚¬μš©ν•  수 μžˆλ„λ‘ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.
  • λͺ©ν‘œ
    • μ‹œκ° μž₯μ•  ν•™μƒλ“€μ—κ²Œ 독립적이고 μ ‘κ·Ό κ°€λŠ₯ν•œ ν•™μŠ΅ κ²½ν—˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.
  • 핡심 κΈ°λŠ₯
    • λΉ„λ””μ˜€μ˜ μ‹œκ° μš”μ†Œμ— λŒ€ν•œ μ˜€λ””μ˜€ μ„€λͺ…을 μžλ™ μƒμ„±ν•˜μ—¬ 이해도λ₯Ό λ†’μž…λ‹ˆλ‹€.

πŸ“– Overview

COVID-19 팬데믹 이후 온라인 ν•™μŠ΅μ΄ μ¦κ°€ν•˜λ©΄μ„œ, μ‹œκ° μž₯μ•  학생듀은 μ‹œκ°μ  정보 접근에 어렀움을 κ²ͺκ³  μžˆμŠ΅λ‹ˆλ‹€. LectureVoiceλŠ” κ°•μ˜ μ˜μƒμ˜ λ‹€μ΄μ–΄κ·Έλž¨κ³Ό μ‹œκ° 자료λ₯Ό λΆ„μ„ν•˜κ³  μ„€λͺ…ν•˜μ—¬ μ΄λŸ¬ν•œ 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€.


πŸ” μ£Όμš” κΈ°λŠ₯

1️⃣ μŒμ„± ν™œμ„±ν™” μΈν„°νŽ˜μ΄μŠ€

  • μ™„μ „ν•œ μŒμ„± μ œμ–΄λ‘œ μ‹œκ° μž₯μ•  μ‚¬μš©μžκ°€ μ•±κ³Ό μƒν˜Έμž‘μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

2️⃣ μžλ™ λΉ„λ””μ˜€ 뢄석

  • LectureVoiceλŠ” κ°•μ˜ λΉ„λ””μ˜€μ˜ ν™”λ©΄ μ „ν™˜μ„ κ°μ§€ν•˜κ³ , ν…μŠ€νŠΈμ™€ 이미지λ₯Ό μΆ”μΆœν•˜μ—¬ μ„€λͺ…을 μƒμ„±ν•©λ‹ˆλ‹€.

3️⃣ μ‹œκ°μ  자료 ν•΄μ„€

  • ν…μŠ€νŠΈ, κ·Έλ¦Ό, ν‘œ, λ‹€μ΄μ–΄κ·Έλž¨ λ“± μ‹œκ°μ  자료의 μœ ν˜•μ— λ§žλŠ” ν•΄μ„€ 방법을 μ„ νƒν•˜μ—¬ μ •ν™•ν•œ 이해λ₯Ό λ•λŠ” μŒμ„± 해섀을 μƒμ„±ν•©λ‹ˆλ‹€.

4️⃣ λ‹€μ΄μ–΄κ·Έλž¨ ν•΄μ„€

  • λ§žμΆ€ν˜• μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•˜μ—¬ λ‹€μ΄μ–΄κ·Έλž¨μ˜ ν™”μ‚΄ν‘œ, 블둝, ν…μŠ€νŠΈλ₯Ό λΆ„μ„ν•˜κ³ , 의미 μžˆλŠ” λ‚΄λŸ¬ν‹°λΈŒλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

πŸ› οΈ μ‹œμŠ€ν…œ μ•„ν‚€ν…μ²˜

LectureVoiceλŠ” Dart와 Flutter ν”„λ ˆμž„μ›Œν¬λ‘œ 개발된 λͺ¨λ°”일 μ• ν”Œλ¦¬μΌ€μ΄μ…˜μž…λ‹ˆλ‹€. λ‹€μ–‘ν•œ λ°±μ—”λ“œ 기술과 APIκ°€ ν†΅ν•©λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€:

  • μ„œλ²„: Flask와 Python으둜 개발
  • ν…μŠ€νŠΈ 인식: Naver Clova OCR API μ‚¬μš©
  • 이미지 캑셔닝: Google Cloud Image Captioning API μ‚¬μš©
  • μ˜€λ””μ˜€ 좜λ ₯: Google Cloud Text-to-Speech API μ‚¬μš©

πŸ“Ί λΉ„λ””μ˜€ 처리 흐름

  1. μž₯λ©΄ 감지
    • PySceneDetect APIλ₯Ό μ‚¬μš©ν•˜μ—¬ μž₯λ©΄ μ „ν™˜μ„ κ°μ§€ν•˜κ³ , 각 μ „ν™˜ μ§€μ μ—μ„œ 이미지λ₯Ό μΊ‘μ²˜ν•©λ‹ˆλ‹€.
  2. ν…μŠ€νŠΈ μΆ”μΆœ
    • OCR을 톡해 캑처된 μ΄λ―Έμ§€μ—μ„œ ν…μŠ€νŠΈλ₯Ό μΆ”μΆœν•˜κ³ , 곡간 μ’Œν‘œμ™€ ν•¨κ»˜ μ €μž₯ν•©λ‹ˆλ‹€.
  3. λ‹€μ΄μ–΄κ·Έλž¨ 뢄석
    • λ§žμΆ€ν˜• μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•΄ λ‹€μ΄μ–΄κ·Έλž¨μ„ λΆ„μ„ν•˜κ³ , μƒμ„Έν•œ μ„€λͺ…을 μƒμ„±ν•©λ‹ˆλ‹€.
  4. ν•΄μ„€ 생성
    • μΆ”μΆœλœ ν…μŠ€νŠΈμ™€ 이미지 μ„€λͺ…을 μ’…ν•©ν•˜μ—¬ λΉ„λ””μ˜€ μž¬μƒκ³Ό λ™κΈ°ν™”λœ ν…μŠ€νŠΈ νŒŒμΌμ„ μƒμ„±ν•©λ‹ˆλ‹€.

πŸ“ λ‹€μ΄μ–΄κ·Έλž¨ ν•΄μ„€ μ•Œκ³ λ¦¬μ¦˜

LectureVoice의 μ•Œκ³ λ¦¬μ¦˜μ€ λ‹€μ΄μ–΄κ·Έλž¨ μ΄λ―Έμ§€μ—μ„œ **λͺ¨μ–‘(ν™”μ‚΄ν‘œ, μ‚¬κ°ν˜•)**을 κ°μ§€ν•˜κ³ , κ΅¬μ‘°ν™”λœ μ„€λͺ…을 μƒμ„±ν•©λ‹ˆλ‹€:

  • μœ€κ³½μ„  감지: λ‹€μ΄μ–΄κ·Έλž¨μ˜ κ°€μž₯자리λ₯Ό μ‹λ³„ν•˜κ³ , 이λ₯Ό ν™”μ‚΄ν‘œλ‚˜ λΈ”λ‘μœΌλ‘œ λΆ„λ₯˜ν•©λ‹ˆλ‹€.
  • ν…μŠ€νŠΈ μ—°κ΄€μ„± 뢄석: ν…μŠ€νŠΈλ₯Ό λ‹€μ΄μ–΄κ·Έλž¨ μš”μ†Œμ™€ μ—°κ²°ν•˜μ—¬ 관계λ₯Ό μ„€λͺ…ν•©λ‹ˆλ‹€.
  • λ‚΄λŸ¬ν‹°λΈŒ 생성: λ‹€μ΄μ–΄κ·Έλž¨μ— λŒ€ν•œ μΌκ΄€λœ μ„€λͺ…을 μƒμ„±ν•˜μ—¬ μ‹œκ° μž₯μ•  μ‚¬μš©μžκ°€ λ³΅μž‘ν•œ μ‹œκ° 정보λ₯Ό 이해할 수 μžˆλ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

πŸ“Š 평가

LectureVoiceλŠ” μ‚¬μš©μ„± 및 λ§Œμ‘±λ„ ν‰κ°€μ—μ„œ ν‘œμ€€ 이미지 캑셔닝 방식보닀 높은 이해도λ₯Ό λ³΄μ˜€μŠ΅λ‹ˆλ‹€. μ‹œκ° μž₯μ•  ν•™μƒλ“€μ˜ ν”Όλ“œλ°±μ€ ν•΄μ„€μ˜ λͺ…ν™•μ„±κ³Ό μœ μš©μ„±μ„ κ°•μ‘°ν–ˆμŠ΅λ‹ˆλ‹€.


πŸš€ μ‚¬μš© 방법

  1. 앱을 μ‹€ν–‰ν•˜κ³  κΈ°κΈ° κ°€λŸ¬λ¦¬μ—μ„œ κ°•μ˜ λΉ„λ””μ˜€λ₯Ό μ„ νƒν•˜μ„Έμš”.
  2. 앱이 λΉ„λ””μ˜€λ₯Ό μ²˜λ¦¬ν•˜κ³ , 각 μž₯면에 λŒ€ν•œ 해섀을 μƒμ„±ν•©λ‹ˆλ‹€.
  3. λΉ„λ””μ˜€λ₯Ό μž¬μƒν•˜μ—¬ μž₯λ©΄ μ „ν™˜λ§ˆλ‹€ μ˜€λ””μ˜€ μ„€λͺ…을 듀을 수 μžˆμŠ΅λ‹ˆλ‹€.

λͺ¨λ°”일앱 κ΅¬ν˜„ μ˜ˆμ‹œ


πŸ“₯ μ„€μΉ˜ 방법

LectureVoiceλŠ” Android 및 iOS ν”Œλž«νΌμ—μ„œ μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ„€μΉ˜ 방법은 λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

  • λ ˆν¬μ§€ν† λ¦¬ 클둠:
    git clone https://github.com/nan0silver/DiagramAnalysisGenerationAlgorithm
    
    

πŸ“¦ μ˜μ‘΄μ„±


πŸ“„ μ°Έκ³  자료