빅데이터 QAQC_3기/빅데이터 QAQC_3기 TIL

TIL_251124

usungusung 2025. 11. 24. 21:36

Today I learned

 

 

1. [라이브세션] 태블로 4회차

1) TabPy란?

  • Tableau ↔ Python 연결 서버
  • Tableau 내부에서 Python 코드 실행 가능
    (numpy, pandas, scikit-learn, Prophet 등)
  • SCRIPT 함수로 Python 코드 호출
    • SCRIPT_REAL, SCRIPT_INT, SCRIPT_STR, SCRIPT_BOOL
  • Tableau 필드 → Python 인자로 전달 (_arg1, _arg2 …)

핵심 키워드

TabPy SCRIPT_REAL _arg1 Python-Tableau 연동 외부 서비스 연결 머신러닝 모델 Tableau 실행


2) TabPy 설치 & 연결

  • pip install tabpy → tabpy 실행
  • 접속: http://localhost:9004
  • Tableau → 분석 → 외부 서비스 연결
    • Host: localhost
    • Port: 9004

키워드

tabpy 설치 localhost:9004 외부 서비스 연결


3) KMeans 클러스터링 (Tableau + Python)

3-1) KMeans 개념

  • 비지도 학습 / 데이터 패턴 그룹화
  • 단계: K 결정 → 초기 중심점 → 할당 → 업데이트 → 수렴

3-2) MiniBatch KMeans

  • 대용량 데이터용 빠른 버전
  • 전체 대신 샘플 배치 단위로 업데이트

3-3) Tableau 구현

  • 파라미터
    • Algorithm 선택 (KMeans / MiniBatchKMeans)
    • Cluster Numbers 입력
  • SCRIPT_INT로 Python 실행하여 cluster label 반환

핵심 코드 (요약)

 
labels = KMeans(...).fit_predict(X) return labels.tolist()

키워드

KMeans MiniBatchKMeans 클러스터링 SCRIPT_INT Tableau clustering 파라미터 기반 클러스터


4) Prophet 시계열 예측

Prophet 특징

  • Facebook 개발 시계열 라이브러리
  • 트렌드 + 계절성 + 휴일효과 자동 반영
  • 일·주·월 데이터에 강함

Tableau + Prophet 구성

  • ARG1: 날짜(스캐폴드)
  • ARG2: 실데이터 (매출 등)
  • ARG3: 예측 기간 (파라미터)

핵심 코드 (요약)

 
m = Prophet(yearly_seasonality=True, weekly_seasonality=True) m.fit(hist) future = m.make_future_dataframe(periods=periods)

키워드

Prophet 시계열 예측 TabPy Forecast P_Periods C_Time Series Forecasting

 

 

2. [라이브세션] Streamlit 2회차

1) 텍스트 & 출력 함수

  • st.header, st.subheader, st.markdown
  • st.caption, st.text, st.write
  • 코드/수식
    • st.code, st.latex

키워드

st.header st.markdown st.write st.code LaTeX


2) 입력 위젯 (Input Widgets)

텍스트 입력

  • st.text_input
  • st.text_area

숫자/날짜

  • st.number_input
  • st.date_input

선택형

  • st.selectbox
  • st.multiselect
  • st.radio

버튼/슬라이더

  • st.button
  • st.slider

파일 업로드

  • st.file_uploader(type=['csv'])

키워드

input widget selectbox multiselect radio file_uploader slider


3) 그래프 시각화

Streamlit 기본 차트

  • st.line_chart, st.bar_chart, st.area_chart

Matplotlib / Seaborn

  • st.pyplot(fig)
  • pyplot vs 객체지향 방식 비교(자동카메라 vs DSLR 비유)
  • 한글 깨짐 해결: pip install koreanize-matplotlib

Plotly

  • st.plotly_chart(fig)
  • 마우스 인터랙션, 줌, hover tooltip 가능

키워드

st.line_chart st.pyplot 객체지향 matplotlib koreanize_matplotlib plotly scatter


4) 실습 예제

MBTI 판독기

  • 4개 radio 버튼으로 MBTI 생성
  • 유형별 설명 + 주의점 출력

Gapminder 인터랙티브 차트

  • 연도 슬라이더 (st.slider)
  • 무작위 대륙 버튼 (st.button)
  • Plotly scatter 시각화

키워드

MBTI 판독기 Gapminder session state 없음 인터랙티브 대시보드

'빅데이터 QAQC_3기 > 빅데이터 QAQC_3기 TIL' 카테고리의 다른 글

TIL_251126  (0) 2025.11.26
TIL_251125  (0) 2025.11.25
TIL_251121  (1) 2025.11.21
TIL_251120  (0) 2025.11.20
TIL_251119  (0) 2025.11.19