빅데이터 QAQC_3기/빅데이터 QAQC_3기 TIL

TIL_260126

usungusung 2026. 1. 26. 21:26

최종프로젝트

 

튜터님 피드백

 

 

모델 전략:
성능이 안정적으로 나온 4개 장비만 메인 모델로 사용하는 판단은 타당.
F1≈0.5 수준 장비는 실사용 비권장, 대시보드에서는 주의 필요 또는 제외 처리 권장.
블루 모델은 데이터 밀도·성능 모두 애매하여 버리고 가도 문제 없음.


분류 모델 기준:
24샷 단위 집계 기준 불량률 15% 설정은 합리적.
다만 “GPT가 말해서”가 아니라 AQL 표 기반 근거 보완 필요.


Optuna 사용 맥락:
Optuna는 새로운 모델이 아니라 하이퍼파라미터 최적화 도구로 사용됨.
전체 탐색은 시간 과다 → 이미 성능 좋았던 파라미터 세트만 추려 재실행한 전략은 적절.
노이즈 제거 비율을 바꿔가며 F1 최대 지점 선택 → 이후 리콜 보정 흐름은 합리적.
최종적으로 Confusion Matrix만 추가 점검하면 충분.


이상탐지 모델:
모델 자체 성능과 논리는 문제 없음.
핵심은 대시보드에서 ‘현재 공정 상태를 직관적으로 보여주는 방식’.

 

시그마/운영 기준:
• 평균 불량률 약 6% 상황에서
0.5σ 이하 = 안정,
0.5~1.5σ = 주의,
1.5σ 초과 = 위험
 구간 설정은 현실적이며 부담을 줄인 판단으로 긍정 평가.


대시보드 구성 방향:
1페이지: 일자·시간별 공정 현황(가동/비가동/대기/불량 요약)
2페이지: 분류 모델 결과(신뢰 가능한 4개 장비 중심)
3페이지: 이상탐지 결과
SHAP은 그래프 나열 없이 **“어디가 문제인지 요약 설명용”**으로만 사용


n8n 역할:
모델 결과를 받아 이상 발생 시 자동 알림(문자·슬랙·메일) 보내는 자동화 파이프라인 용도.
모델 판단 → 행동으로 바로 이어지게 하는 운영 도구.


확장 과제:
이미지 모델, 추가 자동화는 대시보드 구축 완료 후 여유 있을 때 진행.

'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글

TIL_260202  (0) 2026.02.02
TIL_260130  (1) 2026.01.30
TIL_260119  (0) 2026.01.19
TIL_260116  (0) 2026.01.16
TIL_260114  (0) 2026.01.14