빅데이터 QAQC_3기/빅데이터 QAQC_3기 TIL

TIL_251121

usungusung 2025. 11. 21. 20:52

Today I learned

 

 

1. 시계열과 MLops 3회차 퀴즈

 

1. 자기상관함수(ACF)

겁먹지 말고 상관관계라고 이해하셈

상관관계를 만들어준느 함수라고 보고,

시차가 0일 때는 자기 자신과의 상관관계를 하는 거니까 항상 1이고

천천히 감소하는 패턴, 그러니까 자연스럽게 감소하는 패턴은 뚝 떨어지지 않고 느슨하게, 물결치는 모양이 있음 계절성ㅇ르 탄다고 함

ACF는 MA모델이고, 자기 회귀 모델은 Particial하게 본다.

MA: 과거의 오차 항이 영향을 끼친다, 누적됨을 보기 때문에 자기상관함수

AR: 특정 시점에서 보기 때문에 편자기함수

 

2. Statsmodels 라이브러리

예측만을 최우선으로 하는건 Scikit-learn, 얘는 에측을 위해 해석력을 포기한거임

모델의 결과에 대한 설명이나 검증에 관심이 있는게 statsmodels

 

3. 예측 오차들의 선형 결합으로 이루어진 모델, 과거의 충격이나 예측 실패가 누적되어 현재에 영향을 미치는 구조를 모델링 한 것

MA
밑줄친 부분은 MA의 핵심 특징임

 

4. ACF와 PACF

AR의 차수 p를 결정할 때는 PACF

MA의 차수 q를 결정할 때는 ACF

 

5. 그래프 보기

MA의 ACF에서, 파란색 점선이 p-value 가이드라인을 말함. 첫번째는 자기 자신을 의미하는 것이기 때문에 제외해야 함.

따라서 차수 q = 4 처럼 보여도 q = 3이 맞는거임!

 

 

2. [라이브세션] 태블로 prep

 

태블로 prep: 데이터 준비 도구,

전처리 진행 중에 데이터 분석까지 돕는 툴

 

- Tidy Data

분석하기 좋은 데이터셋

데이터셋: 값들의 집합으로, 숫자 또는 범주로 구성

values: 변수와 관측값으로 구성

Variable: 동일한 속성(나이, 매출)에 대한 측정값들로 행(column)을 구성

Observation: 동일한 대상에 대한 측정값들로 열 구성.

 

나쁜 예시 / 좋은 예

 

 

3. [라이브세션] streamlit

 

. 대시보드란? (Why Dashboard?)

  • 데이터가 넘쳐나는 시대에 의사결정 속도와 효율을 높이기 위한 시각화 도구
  • 다양한 KPI를 한 화면에서 직관적으로 확인
  • 실시간/정기 업데이트 가능, 사용자 맞춤형 구성, 시각적 직관성 강조

❌ 나쁜 대시보드

  • 지표 과잉
  • 연관성 없는 데이터 나열
  • 과도한 디자인 요소
  • 인사이트나 액션 포인트 부재

✅ 좋은 대시보드

  • 목적이 명확
  • 핵심 KPI 중심 구성
  • 비교/맥락 제공(시간·목표·전년 대비 등)
  • 필터·드릴다운 등 인터랙티브 기능 제공
  • 설계 전 5W1H(Who·Why·What·How·When) 확인

2. 제조업에서 자주 쓰는 KPI 정리

  • 가동률(Uptime)
  • 비가동률(Downtime)
  • FPY(초기 합격률)
  • 불량률(Defect Rate)
  • 스크랩률(Scrap Rate)
  • Throughput(생산 처리량)
  • Cycle Time(사이클 타임)

PDF에는 각 지표의 정의, 활용 목적, 계산식이 모두 포함됨. (예: FPY = 첫 합격 / 전체 생산 ×100%)

Streamlit_세션_1회차


3. Streamlit이란?

  • Python 기반 웹앱·대시보드 프레임워크
  • 웹 개발 지식 없이도 파이썬 코드만으로 대시보드 제작
  • 실시간 업데이트, 다양한 위젯, 쉬운 배포(Streamlit Cloud)

Tableau vs Streamlit

  • Tableau: BI 목적 시각화에 강점
  • Streamlit: ML 모델/데이터 분석 결과를 앱 형태로 빠르게 보여주기 최적화

4. Streamlit 설치 & 기본 실행

설치

 
pip install streamlit pip list # 설치 확인

실행

 
streamlit run 파일이름.py

예제 코드

 
import streamlit as st st.title('QA/QC 트랙 여러분들 반갑습니다.')

데모 실행

 
streamlit hello

종료

  • 터미널에서 Ctrl + C
  • 혹은 터미널 창 닫기

5. 파이썬 실행 방식

  • .ipynb: Jupyter Notebook (대화형, 단계별 실행)
  • .py: 파이썬 스크립트 (전체 실행, 프로젝트 관리용)

'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글

TIL_251125  (0) 2025.11.25
TIL_251124  (0) 2025.11.24
TIL_251120  (0) 2025.11.20
TIL_251119  (0) 2025.11.19
TIL_251118  (0) 2025.11.18