Today I learned
1. [라이브세션] 멀티모달 2회차
1. 강의 목적
이번 수업은 CNN 기반 이미지 분류와 전이학습을 이해하고, 이를 확장해 **제조업 불량 검출(Object Detection)**까지 적용하는 것을 목표로 한다.
MNIST, Cats vs Dogs, YOLOv8 실습을 통해 컴퓨터 비전의 전체 흐름을 경험한다.
2. 컴퓨터 비전 작업 유형 정리
컴퓨터 비전은 다음과 같은 주요 문제로 구분된다.
- Image Classification: 이미지 전체를 하나의 클래스로 분류
- Classification + Localization: 분류 + 객체 위치
- Object Detection: 이미지 내 여러 객체의 위치와 클래스 예측
- Instance Segmentation: 객체 단위 픽셀 수준 분할
이번 회차의 중심은 Image Classification → Object Detection으로 확장하는 구조다.
3. 전이학습(Transfer Learning)
개념
- ImageNet 등 대규모 데이터로 사전 학습된 모델의 가중치를 새로운 문제에 활용
- 학습 시간 단축 + 적은 데이터에서도 높은 성능 확보 가능
두 가지 방식
① Feature Extraction
- CNN backbone은 freeze
- 마지막 classifier만 학습
- 데이터가 적을 때 유리
② Fine-tuning
- 전체 레이어를 trainable로 설정
- 모델을 새로운 데이터에 맞게 미세 조정
- 데이터가 충분할수록 성능 향상 가능
4. 데이터 증강(Data Augmentation)
목적
- 과적합 방지
- 모델의 일반화 성능 향상
- 데이터 부족 문제 완화
주요 기법
- 회전, 반전
- Crop
- 색상/채도 변경
- 노이즈 추가
5. ImageNet과 CNN 발전 흐름
- ILSVRC(ImageNet Challenge)를 통해 CNN 성능 급격히 발전
- 2012년 AlexNet이 딥러닝 전환점
- 이후 VGG → GoogLeNet → ResNet 등장
- 2015년 이후 인간 인식 정확도 초과
6. 주요 모델 정리
VGG16 / VGG19
- 3×3 convolution 기반의 단순한 구조
- 전이학습에 자주 활용
- 깊어질수록 성능 저하 한계 존재
ResNet
- Skip Connection(Residual Block) 구조
- Gradient Vanishing 문제 해결
- 매우 깊은 네트워크(최대 152 layers) 학습 가능
7. 실습 내용
- Cats vs Dogs 이미지 분류 (전이학습 적용)
- ImageNet 사전학습 모델 활용
- YOLOv8 기반 제조업 불량 이미지 결함 검출
- 결함 검출 결과 시각화 및 성능 개선 논의
2. 최종프로젝트
데이터셋 매칭 성공
IQR기반 ± cycletime
'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글
| TIL_260109 (1) | 2026.01.09 |
|---|---|
| TIL_260128 (0) | 2026.01.08 |
| TIL_260106 (0) | 2026.01.06 |
| TIL_260105 (0) | 2026.01.05 |
| TIL_260102 (0) | 2026.01.02 |