HaptiTalk - 실시간 대화 코칭 시스템

실시간 대화 분석과 햅틱 피드백을 결합한 AI 서비스 기반 커뮤니케이션 코칭 시스템

프로젝트 개요

HaptiTalk은 발표, 면접 등 실제 대면 상황에서 스마트워치를 통한 은밀한 햅틱 피드백으로 즉각적인 대화 코칭을 제공하는 시스템입니다. HaptiTalk은 기존 커뮤니케이션 코칭 도구의 한계를 뛰어넘는 실시간 솔루션을 제시합니다.

핵심 가치

실시간 대화 분석: WhisperX 기반 고성능 STT 및 음성 분석
은밀한 햅틱(진동) 피드백: 상대방 모르게 받는 자연스러운 실시간 코칭
세그먼트 기반 분석: 기존 방식 대비 85% 향상된 말하기 속도 측정 정확도
시나리오별 맞춤화: 발표/면접 상황별 특화된 분석 및 피드백

개발팀

개발 기간: 2025년 3월 4일 ~ 6월 12일 (총 14주)

역할	이름	전문 분야	연락처
팀장 & 풀스택	최태산	시스템 설계/통합, DevOps	xotks7524@gmail.com
AI/ML	정연균	음성처리, 감정분석	jungyk411@sunmoon.ac.kr
프론트엔드	이은범	Flutter, 모바일 개발	bum17822@naver.com

영상 종류	썸네일 및 링크
소개 영상
시연 영상

시스템 아키텍처

AI 처리 파이프라인

STT Engine: WhisperX v3.3.4 기반 실시간 음성 인식
Emotion Analysis: Wav2Vec2-XLSR 모델로 7가지 감정 분류
Speaker Diarization: pyannote.audio 3.1 다중 화자 식별
AI Report: Google Gemini API 기반 맞춤형 분석 보고서

ERD

MongoDB Schema Diagram

주요 기능

주요 화면 구성

로그인 화면	회원가입 화면	메인 화면	프로필 화면

새 세션 시작 화면	실시간 분석 화면	햅틱 패턴 연습 화면	설정 화면

분석 요약 화면	타임라인 화면	말하기 패턴 화면	대화 주제 화면

Apple Watch 화면

메인 화면	세션 화면	설정 화면

Apple Watch 햅틱 피드백 애니메이션

말하기 속도 조절	필러워드 감지	자신감 상승	자신감 하락

기술 스택

Frontend

Flutter 3.x          │ 크로스 플랫폼 모바일 앱
├── Provider         │ 상태 관리
├── WebSocket        │ 실시간 통신  
├── Watch Connectivity│ 스마트워치 연동
└── Material Design 3│ 현대적 UI/UX

Backend Services

Node.js + Express    │ 마이크로서비스 프레임워크
├── auth-service     │ JWT 기반 인증 및 권한 관리
├── session-service  │ 세션 생명주기 관리
├── feedback-service │ 햅틱 피드백 생성 및 전송
├── user-service     │ 사용자 프로필 및 설정 관리
├── realtime-service │ WebSocket 실시간 통신
├── report-service   │ AI 보고서 생성 및 관리
└── notification-service │ 푸시 알림 및 이벤트 처리

AI Services

Python + FastAPI     │ AI 마이크로서비스
├── STT Service      │ WhisperX v3.3.4 음성 인식
├── Emotion Analysis │ Wav2Vec2-XLSR 감정 분석
└── Speaker Diarization │ pyannote.audio 화자 분리

Infrastructure

Docker + Compose     │ 컨테이너 오케스트레이션
├── Kong             │ API Gateway 및 인증
├── PostgreSQL       │ 사용자/세션 관계형 데이터
├── MongoDB          │ 비정형 분석 결과 저장
├── Redis            │ 캐싱 및 세션 관리
└── Kafka            │ 비동기 메시징 시스템

Monitoring & DevOps

Observability Stack  │ 통합 관찰성 시스템
├── Prometheus       │ 메트릭 수집 및 저장
├── Grafana          │ 통합 관찰성 플랫폼 (메트릭/로그/트레이스)
├── ELK Stack        │ 로그 수집, 처리 및 검색
├── Jaeger           │ 분산 트레이싱 및 성능 분석
└── OpenTelemetry    │ 트레이스 수집 및 전처리

기술적 특징

세그먼트 기반 말하기 속도 분석

기존 전체 시간 기반 WPM 계산의 한계를 극복한 혁신적 알고리즘:

# 기존 방식 (부정확)
traditional_wpm = total_words / total_time * 60  # pause 시간 포함

# HaptiTalk 세그먼트 방식 (85% 향상)
segment_wpm = (words_in_segment / segment_duration) * 60
average_wpm = sum(segment_wpms) / len(segments)  # 순수 발화 시간만 계산

6가지 말하기 패턴 자동 분류

staccato: 끊어 말하기 패턴 감지
continuous: 연속적 발화 패턴
very_sparse: 매우 띄엄띄엄 말하기
steady: 일정한 속도 유지
variable: 속도 변화가 큰 패턴
normal: 일반적인 대화 패턴

시나리오별 특화 분석

시나리오	VAD 임계값	침묵 허용	감정 가중치	분석 초점
면접	0.7	1000ms	중립(1.3x)	자신감, 명확성
발표	0.75	800ms	안정감 중심	전달력, 설득력

성능 지표

핵심 성능

STT 정확도: 95% 이상 (한국어 기준)
감정 분석 정확도: 87% (7가지 감정 분류)
평균 처리 지연: 150ms 이하 (GPU 환경)
동시 세션 처리: 4개 (Jetson Orin Nano 기준)
모바일 네트워크 지연: 200ms 이하
배터리 최적화: 1시간 연속 사용 시 15% 이하 소모

하드웨어 최적화

NVIDIA Jetson Orin Nano 8GB: ARM64 아키텍처 네이티브 최적화
CUDA 12.6: GPU 가속 처리로 95% 효율성 달성
메모리 사용량: 전체 시스템 6GB 이하 유지

모니터링 시스템

통합 관찰성 플랫폼 (Grafana)

기능: 메트릭, 로그, 트레이스 통합 시각화 및 분석
통합 기능: 트레이스→로그 연결, 메트릭→트레이스 드릴다운
모니터링 항목: API 응답시간, 메모리 사용량, 처리 성공률, 에러율

메트릭 수집 (Prometheus)

기능: 시계열 메트릭 수집 및 저장
수집 대상: 시스템 리소스, 애플리케이션 성능, 데이터베이스 상태
Exporters: Node, PostgreSQL, Redis, MongoDB, Elasticsearch 메트릭

로그 관리 (ELK Stack)

기능: 중앙화된 로그 수집, 처리 및 검색
구성: Filebeat → Logstash → Elasticsearch → Kibana
활용: 에러 추적, 사용자 행동 분석, 성능 병목 식별

분산 트레이싱 (Jaeger)

기능: 마이크로서비스 간 요청 추적 및 성능 분석
수집: OpenTelemetry Collector를 통한 트레이스 데이터 수집
활용: End-to-end 성능 분석, 병목 지점 탐지, 서비스 의존성 분석

프로젝트 성과

기술적 혁신

세계 최초 실시간 대화분석+햅틱피드백 결합 시스템
85% 향상된 세그먼트 기반 말하기 속도 측정 정확도
95% 달성한 한국어 STT 인식 정확도
150ms 이하 실시간 처리 지연시간

수상 및 특허

SW중심대학협의회 SW중심대학 우수작품경진대회 후원기업상 (2025)
선문대학교 SW중심대학 창업 아이디어 경진대회 최우수상 (2025)
선문대학교 SW중심대학 기업연계 프로젝트 우수팀 경진대회 대상 (2025)
한국디지털콘텐츠학회 하계종합학술대회 대학생 논문경진대회 대상 (2025)
제 8회 대학생 창의력 경진대회 우수상 (2025)
특허 출원(완)

연락처

프로젝트 문의

GitHub Issues: 기술적 문의 및 버그 리포트
이메일: xotks7524@gmail.com (프로젝트 총괄)
연구실: 선문대학교 컴퓨터공학부

협업 제안

기업 협력, 연구 참여, 기술 이전 등의 제안은 최태산(xotks7524@gmail.com)에게 직접 연락주시기 바랍니다.

HaptiTalk - Revolutionizing Communication with AI and Haptic Technology

Made with ❤️ by Sunmoon University SW Development Team

Name		Name	Last commit message	Last commit date
Latest commit History 468 Commits
.github/workflows		.github/workflows
ai		ai
api		api
frontend/mobile		frontend/mobile
grafana/provisioning/dashboards/json		grafana/provisioning/dashboards/json
infrastructure		infrastructure
packages/auth-client		packages/auth-client
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
docker-compose.prod.yml		docker-compose.prod.yml
docker-compose.yml		docker-compose.yml
kafka-integration-test.sh		kafka-integration-test.sh
package-lock.json		package-lock.json

Folders and files

Latest commit

History

Repository files navigation

HaptiTalk - 실시간 대화 코칭 시스템

프로젝트 개요

핵심 가치

개발팀

시스템 아키텍처

AI 처리 파이프라인

ERD

MongoDB Schema Diagram

주요 기능

주요 화면 구성

Apple Watch 화면

Apple Watch 햅틱 피드백 애니메이션

기술 스택

Frontend

Backend Services

AI Services

Infrastructure

Monitoring & DevOps

기술적 특징

세그먼트 기반 말하기 속도 분석

6가지 말하기 패턴 자동 분류

시나리오별 특화 분석

성능 지표

핵심 성능

하드웨어 최적화

모니터링 시스템

통합 관찰성 플랫폼 (Grafana)

메트릭 수집 (Prometheus)

로그 관리 (ELK Stack)

분산 트레이싱 (Jaeger)

프로젝트 성과

기술적 혁신

수상 및 특허

연락처

프로젝트 문의

협업 제안

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages