Backend → AI/ML Engineer · SSAFY 14기 서울 Java 전공 (2025.07 ~)
도메인 특화 LLM 파인튜닝부터 프로덕션 서빙까지 End-to-End 구현
LLM Fine-tuning · RAG · vLLM Serving · Prompt Engineering · Data Pipeline
| Period | Role | Focus |
|---|---|---|
| 2024 | Backend Developer | Java/Spring Boot 기반 MSA, Kafka, Redis 고성능 시스템 설계 |
| **2025.07 ~** | AI/ML Engineer | SSAFY 14기 서울 · LLM 정렬(SFT/DPO), 도메인 특화 RAG 및 vLLM 최적화 |
|
YEJI — Fortune LLM 동양+서양 융합 AI 운세 서비스 · 7개 리포 Qwen3 파인튜닝 (5 PEFT 기법, v1~v9) vLLM 서빙 · AWQ 양자화 (16→5.5GB, -65%) 검증 실패율 30%→5% · 추론 성공률 18/18 Jenkins CI/CD · 4대 GPU 통합 인프라 FastAPI vLLM Qwen3 Spring Boot
|
Speaky — AI Character AI 캐릭터 운세 챗봇 · M2 MacBook 배포 SFT + DPO + SimPO 3단계 정렬 학습 6캐릭터 페르소나 · D1-D8 평가 (4.12/5.00) EXAONE 1.2B + E5 인텐트 분류 (13개) SSE 스트리밍 · Cloudflare Tunnel FastAPI vllm-mlx EXAONE Redis
|
|
MyEat MBTI 기반 AI 영양 코칭 · SSAFY 관통프로젝트 Redis Vector Search 2단계 RAG (180K+ 음식 DB) GPT-5 Mini Intent Filter + Embedding Cache 16개 MBTI 페르소나 · CoT 응답 생성 API 비용 50% 절감 · SSE 스트리밍 Java 17 Spring Boot 3.5.8 Redis Stack
|
triflux AI CLI Orchestrator · Claude × Codex × Gemini 멀티 모델 통합 지능형 라우팅 DAG 기반 병렬 실행 엔진 토큰 비용 실시간 추적 · 자동 Fallback TypeScript Node.js LLM API |
50 Repositories (Private 포함) · 700+ Total Downloads
Qwen3 기반 도메인 특화 모델 및 고품질 한국어 데이터셋 구축
| Category | Count | Highlights |
|---|---|---|
| Models | 17 | Qwen3 4B/8B, v1~v9, AWQ/GGUF/MLX Quantized |
| Datasets | 25 | 260K+ 중한 번역 코퍼스, SFT/DPO/SimPO 전용 데이터 |
| Spaces | 1 | yeji-captcha |
| Model | Downloads | Size | Tags |
|---|---|---|---|
| yeji-4b-instruct-v9-AWQ | 123 | 3.2 GB | Qwen3, AWQ, Fortune-telling |
| yeji-8b-rslora-v7 | 90 | 15.3 GB | Qwen3, rsLoRA, High-Precision |
| yeji-8b-rslora-v7-AWQ | 67 | 5.7 GB | Qwen3, AWQ, Optimized |
yeji-bazi-translated-ko: 262,980건 중한 번역 코퍼스 (사주/명리학 특화)
|
|
|



