빅데이터 QAQC_3기/빅데이터 QAQC_3기 TIL

TIL_251217

usungusung 2025. 12. 17. 20:42

Today I learned

 

 

1. 대시보드 프로젝트 진행(~12.17)

 

- 프로젝트 발표 및 피드백

우리 발표의 특징

  • 데이터 구조에 대한 정확한 문제 인식
    • 원 본 데이터가 Lot 단위인 시계열 데이터
    • 단순 batch 기준으로 통합하면 샘플 수가 매우 적어 통계적인 의미가 약해짐
      • 도메인 지식 기반의 구간 분할: Ramp-up/Steady/Ramp-down
        • 통계적 유의성을 챙김
        • 공정 의미를 보존한 분할
        • 실제 설비 동작과 일치하며, 제조 공정 엔지니어가 납득 가능한 구조
        • 구간화 이후 통계적 유의성이 생겼다는 점을 증명
    • 시계열 패턴을 고려한 Feature Engineering
      • 단순 평균/최대/최소를 벗어나
      • 변화랑, lag feature, rolling 기반 feature 사용
        • Rolling window 크기 선택의 설명이 부족함
          • 왜 3,5,10인지
          • 공정 시간과 어떻게 대응되는지
          • window 변화에 따른 패턴 비교의 시각화 필요함
      • But, rolling feature를 생성했으면 시그마 기반 
    • 모델 선정의 타당성
      • 과도한 시계열 딥러닝 X
      • 설명력+안정성 중심의 RF 모델 선택
      • Boost 모델 사용시 과적합 및 노이즈까지 학습할 우려
    • 대시보드 관점의 명확성
      • 분석용이 아니라 의사결정을 보조하는 대시보드 목적에 부합\
      •  

보완점 

  • '최적 공정 시간'이라는 결론의 논리적 방향 수정 필요
    • 시간 자체를 맞춘다기 보단 설비 기준/로트 기준/수량 기준에서 시간이 어떻게 달라져야 하는지를 설명해야 함
    • 초점이 '시간'이 아닌 '기준'이 되어야 함.
  • 2 Sigma를 선정했는데, 선정에 대한 설명 보강이 필요함.
    • 3 σ 기준은 너무 민감하고, 2 σ + 한계선 20% 기준일 때 불량 감지가 잘 됨
      • SPC에서 3 σ 기준이 절대 규칙이 아니긴 하다. 공정 특성에 따라 달라질 수 있다.
        • 불량 특성
        • 리스크 허용 수준
        • 알파/베타 오류 관점
  • Rolling σ & 전체 σ의 혼동 가능성
    • 일부 그래프가 전체 σ인지, rolling σ인지 혼동될 가능성이 있음
    • 명확한 텍스트/범례/주석 필요
  • Rolling Feature와 σ 기반 공정도를 함께 사용하면 개념적인 충돌이 있음
    • SPC의 핵심 전제
      • 각 지점은 독립적인 관측지
      • 분포가 안정 상태
      • 하나의 분포에서 평균과 표준편차를 추정
      • 기준선(±2σ, ±3σ)은 고정 기준
        • 공정이 정상일 때의 분포를 기준으로 이 점이 벗어났는가?
    • Rolling Feature의 전제
      • 데이터는 시간 의존적
      • 이전 값이 현재 값에 영향을 미침
      • 분포가 시간에 따라 변함
      • 평균과 분산은 이동값
        • 지금 시점의 정상 상태는 직전 구간을 기준으로 판단함
  • 그래서 왜 두 개념을 함께 못쓰는가?
    • 문제1. 기준선이 자기 자신을 포함하게 됨
      • Rolling Feature 사용 시 현재 시점 값이 자기 자신을 포함한 window로 평균/ σ를 계산
      • 이상치가 기준선을 스스로 끌어올리거나 낮춤
        • 즉, 이상치가 이상치로 잡히지 않음
    • 문제 2. 공정 기준이 사라짐
      • SPC에서의 σ: 공정이 정상일 때의 분포
      • Rolling Feature에서의 σ: 최근 n개 값의 상태
        • 서로 다른ㄱ ㅐ념
    • 문제 3. QA/QC 기준이 사라짐
      • QAQC관점에서 '이 공정이 규격을 벗어났는가?', '이 로트는 관리 상태인가?'를 궁금해함
      • Rolling σ는 기준이 계속 움직임 -> 관리 상태라는 개념 자체가 흐려짐

 

'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글

TIL_251219  (1) 2025.12.19
TIL_251218  (1) 2025.12.18
TIL_251216  (0) 2025.12.16
TIL_251215  (0) 2025.12.15
TIL_251212  (0) 2025.12.12