신뢰 기반 분류를 위한 4단계 알고리즘 아키텍처
단순 확률 출력에 그치지 않고, 판정의 신뢰도와 불확실성을 정량화하여
"판정 가능 여부" 자체를 먼저 판단합니다.
이는 오판 비용이 높은 R&D 투자 의사결정 환경에 최적화된 설계입니다.
🎯
KLUE-RoBERTa Fusion
한국어 NLP 최고 성능 모델에 산업 도메인·연도 메타데이터를 결합한 Fusion 아키텍처. 텍스트 표현력과 맥락 정보를 동시에 활용합니다.
핵심 모델
⚖️
Temperature Scaling
딥러닝 모델의 고질적 문제인 과신뢰(overconfidence)를 단일 파라미터로 보정합니다. 실제 정확도와 신뢰도 수치를 일치시켜 수치의 의미를 보장합니다.
확률 보정
🔮
Monte Carlo Dropout
동일 입력에 대해 30회 반복 추론 후 분산을 계산합니다. 분산이 임계값을 초과하면 "판정 불가(재검토 필요)" 플래그를 자동으로 부여합니다.
불확실성 정량화
🛡️
Confidence Threshold
신뢰도 0.60 미만 샘플은 판정을 유보하고 전문가 검토를 권고합니다. 오판을 강제하지 않는 "겸손한 AI" 설계로 의사결정 신뢰성을 보장합니다.
거부 옵션
🟢
안정 (신뢰도 ≥ 0.75)
높은 확신. 불확실성이 낮고 결과를 직접 활용 가능합니다.
🟡
주의 (0.60 – 0.74)
중간 확신. 결과 참고 후 담당자 확인을 권고합니다.
🔴
재검토 (< 0.60)
판정 유보. 전문가 검토 또는 추가 정보 입력이 필요합니다.
Bootstrap 신뢰구간 (논문 보고 기준)
전체 실험 결과에 대해 1,000회 Bootstrap 재샘플링으로 95% 신뢰구간을 산출합니다.
Macro-F1 = 0.517 [95% CI: 0.489 ~ 0.544] (n=1,000 bootstrap)