Today I learned
1. 최종프로젝트
피드백
• 10분 로트·5% 불량 기준 폐기
근거 부족, 잘못된 가정으로 판단
로트 단위 불량 판정 방식 중단
• 분석 단위 재정의
샷 단위 + 머신별 분리가 가장 타당
머신은 독립적 특성 보유 → 머신별 분석 필수
이로 인해 10분 단위 집계 불필요해짐
• 분류 모델 역할
• 샷 단위 정상/불량 분류
• 재현율 중심 운영 전략 가능
불합격 → 추가 검사 or 폐기
혼동행렬 기반 비용/손실 판단
• 원인 해석에 대한 입장
분류 모델 단계에서는 원인 해석 필수 아님
이후 이상탐지 단계에서 원인 분석 수행
• 이상탐지 전략
• 단일 변수 기반 → 오탐 높음
• 권장 접근:
변수 그룹화(PCA 기반)
Feature Importance 상위 변수 분석
두 방법 병행 권장
• 연속 불량 점수 누적 → 설비 이상 징후 판단
• AQL/점수제 기반 예지보전 가능
• 전처리·데이터 특성
이상치 대량 제거로 단일 컬럼 해석 위험
집단 패턴 기반 분석 필요
휴먼 에러로 인한 외관 불량 데이터는 제거된 상태
설비 기인 불량 데이터만 남아 있음
• SPC
데이터 분포가 커도 적용 가능
보조 분석으로 시도 가치 있음
• 변수 중복 처리
상관계수 0.9 이상 변수 → 제거 대신 PCA로 축소
피크압, 금형온도 등 묶어서 잠재 변수화 가능
• 결론
샷 단위·머신별 데이터로 재구성
분류 → 이상탐지 → 원인분석의 단계적 접근
PCA 기반 변수 그룹 + 중요 변수 분석 병행 진행
중간 보고서 목적의 PPT 작성 진행중
'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글
| TIL_260126 (0) | 2026.01.26 |
|---|---|
| TIL_260119 (0) | 2026.01.19 |
| TIL_260114 (0) | 2026.01.14 |
| TIL_260112 (1) | 2026.01.12 |
| TIL_260109 (1) | 2026.01.09 |