빅데이터 QAQC_3기/빅데이터 QAQC_3기 TIL

TIL_260119

usungusung 2026. 1. 19. 20:54

Today I learned

 

 

1. 최종프로젝트

 

피드백

 

 

1. 현재 팀 접근에 대한 튜터의 전체적 인식

  • 지금 접근은 “할 수 있는 건 다 해보자” 쪽으로 너무 확장됨
  • 중간보고 단계치고는
    • 지표 정의
    • 모델 개수
    • 판단 기준
      동시에 너무 많이 열려 있음
  • 문제는 틀렸다가 아니라
    **“왜 이걸 해야 하는지에 대한 근거가 아직 정리되지 않았다”**는 점

2. AQL 지표형 샘플링 적용에 대한 피드백 (가장 부정적)

(1) 핵심 문제

  • AQL은 사람이 수동 검사한 결과를 전제로 한 품질관리 규칙
  • 지금 팀 데이터는:
    • 모델 예측 결과
    • 불량이 극소수
    • FN/FP 비율도 인위적으로 해석 중
  • 즉,
  • AQL을 가져왔지만, AQL이 성립하는 전제가 없음

(2) 특히 문제로 본 부분

  • 1:3 → 5 → 15샷 연속 합격 같은 수치
    • 전부 팀에서 만들어낸 숫자
    • 왜 5인지, 왜 2인지 설명 불가
  • “불량이 적으니까 곱해서 보정한다”는 논리도
    • 통계적·도메인적 근거 모두 부족

(3) 결론

  • 지표로 쓰기에는 아직 위험
  • 튜터도 “틀렸다”기보다는
    **“이해되지 않는다 / 설득되지 않는다”**는 표현 사용
  • 👉 중간보고에서 빼거나, 아이디어 수준으로만 언급

3. 변수 그룹화 + 이상치 탐지에 대한 정확한 평가

(1) 튜터의 핵심 정리

  • 지금 말한 “변수 4개 그룹 + RCF”는
    • 이상치 탐지 모델이라기보다
    • 👉 기술 통계 모니터링

(2) 왜 이상치 탐지가 아니라고 했나

  • 이상치 탐지는:
    • “정상 패턴에서 벗어났는가?”
  • 지금 방식은:
    • “이 수치가 커졌는가?”
    • “분포가 어떻게 변했는가?”
  • 즉,
  • 모델이 판단한다기보다 사람이 그래프를 해석하는 구조

(3) 그렇다고 쓸모없는 건 아님

  • 보조 지표로는 충분히 의미 있음
  • 단,
    • 대시보드 전면 배치 ❌
    • Indicator(신호등) 형태가 적절

4. 대시보드 설계에 대한 명확한 가이드

(1) 튜터가 제안한 구조

  • 1페이지:
    • 설비별 상태 Indicator
      • 정상 / 주의 / 중지
  • 2페이지 이후:
    • RCF score 시계열
    • 변수 그룹별 분포
    • 상세 그래프

(2) 이유

  • 현업은:
    • 숫자 해석할 시간 없음
    • “지금 뭘 해야 하냐”가 중요
  • 그래서
  • 숫자 → 판단 → 행동
    이 연결이 한 번에 보여야 함

5. 이상치 탐지 모델 개수에 대한 강한 경고

(1) 튜터의 명확한 메시지

  • “이상치 탐지면 하나만 해도 된다
  • RCF 하나 + (비교용으로 IF 정도면 충분)

(2) 지금 구조의 문제

  • 설비별 × 변수그룹별 × 모델별
  • 정보량 과잉
  • → 대시보드가 어지러워짐
  • → 무엇이 중요한지 모르게 됨

(3) 튜터가 던진 핵심 질문

  • “이 변수들, 다 중요하다고 말할 수 있나?
  • “우선순위가 있나?”

👉 변수 중요도 선별이 모델링보다 먼저


6. 평가 지표에 대한 현실적인 조언

(1) 변수별 평가는 어렵다

  • 이상치 탐지는 정답 라벨이 없음
  • “이 변수 때문에 이상이다”를 정량 평가하는 건 거의 불가능

(2) 가능한 평가 방식

  • 설비 단위 / 시계열 단위로
    • 이상치로 잡힌 구간에
    • 실제 이슈가 있었는가?
  • 즉,
  • 모델 단위로 맞췄는지 / 못 맞췄는지만 보면 충분

7. 튜터가 인정한 부분 (중요)

  • 3번 (기존 ML 기반 방법)
  • 4번 (SPC 기반 방법)
    제조업에서 이미 검증된 접근
    → 그대로 진행해도 무방

단,

  • 이것들도 “지표 정의”가 아니라
  • 모니터링 / 탐지 수단임을 명확히 할 것

8. 중간보고 기준 최종 정리 (튜터 의도)

지금 해야 할 것

  1. 핵심 방법 1~2개만 명확히
    • RCF 기반 설비 이상 탐지
    • SPC 또는 기존 ML 결과
  2. Indicator 중심 대시보드 컨셉 정리
  3. 나머지는 “향후 검토 과제”로 남기기

지금 하지 말아야 할 것

  • AQL 수치 확정
  • 임계값 고정
  • 다중 방어선 완성 선언

'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글

TIL_260130  (1) 2026.01.30
TIL_260126  (0) 2026.01.26
TIL_260116  (0) 2026.01.16
TIL_260114  (0) 2026.01.14
TIL_260112  (1) 2026.01.12