You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
fix: 검색 품질 개선 — kind soft boost, phrase 필터, evidence threshold 조정
## 개선 내역 (벤치마크 검증)
### 1. agent_search kind 필터: hard filter → soft boost (MRR +9.0%)
- search.py: node_kinds 매칭 시 하드 제거 → 1.5x score boost로 변경
- 자체 시나리오 MRR 0.767 → 0.836 (+9.0%), R@5 0.700 → 0.750 (+7.1%)
- recall 보존하면서 preferred kind 우선 랭킹
### 2. _phrase 노드 검색 결과 노출 차단
- search.py: phrase 노드 fallback padding 제거 — 부족하면 적은 결과 반환
- S8 LLM ablation에서 phrase 노이즈로 MRR -6.8% 발생했던 원인 해결
### 3. Evidence Chain 압축 threshold 상향
- evidence.py: relevance_threshold 0.2 → 0.3 (불필요한 문장 제거)
- 첫 문장 position bias +0.1 추가 (주요 정보는 첫 문장에 집중)
### 4. PhraseExtractor year 추출 dead code 제거
- phrase_extractor.py: _RE_YEAR regex 삭제 (_is_meaningful이 digits 차단하여 실질 미동작)
### FTS word boundary 시도 → 롤백
- 영문 의학 용어(APOE4, BRCA) + 형태 변화(stocks)에서 매칭 실패
- SciFact -27.5%, FiQA -42.4% 악화 → substring 매칭 유지
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
0 commit comments