1. 데이터 분석 프로젝트의 출발점 : 데이터를 받았을 때 가장 먼저 해야 할 것 핵심 원칙
데이터 분석은 기술이 아니라의사결정 지원이다.
1-1. Why / What / How를 먼저 정의
Why: 왜 이 분석을 하는가?
What: 무엇을 예측·설명하고 싶은가?
How: 이 결과로 누가 어떤 결정을 내리는가?
1-2. 비즈니스 맥락 파악 어떤 데이터가 필요한가? 분석 결과로누가 행동(Action)해야 하는가?
단순 정확도보다의사결정에 쓰이는가가 중요
1-3. Target & 가설 설정 • Target 변수 명확화 (매출, 이탈, 불량, 금리 민감도 등) • “이 요인이 결과에 영향을 줄 것이다”라는가설 기반 접근 • 수백 개 컬럼 중우선순위 설정이 가능해짐c9ca469b-d77a-42e8-8084-7adff40…2. EDA 단계에서 길을 잃지 않는 방법 : 컬럼이 많고 구조가 복잡할 때 2-1. 메타데이터부터 본다
Data Dictionary로 컬럼 의미 파악
수치형 / 범주형 / 시계열 여부 확인
2-2. 컬럼 스크리닝 전략 •DA 관점: 지표 계산에 필요한 컬럼 위주 •ML 관점: 상관계수 간단한 모델(RandomForest 등)로 중요 변수 1차 선별 2-3. 데이터의 “생성 단위” 확인
일별 데이터인가?
고객 단위인가?
시계열 단위가 섞여 있는가?
→ 이 단계에서분석의 한계 / 사용 불가능한 데이터도 같이 파악c9ca469b-d77a-42e8-8084-7adff40…3. 분석의 완성도란 무엇인가? : “실무적으로 의미 있는 분석”의 기준 복잡한 알고리즘 = 좋은 분석 Action으로 이어지는 분석 3-1. So What에 답해야 한다 “그래서 무엇을 해야 하는가?”
Low accuracy라도의사결정 힌트가 되면 가치 있음
3-2. ROI 관점 • 0.1% 정확도 개선에 1달? • 80% 정확도로 바로 실행? → 상황에 따라 후자가 더 가치 있음 3-3. 해석 가능성 • 이해관계자가이해·설득 가능해야 함 • “왜 이런 결과가 나왔는지” 설명 가능해야 실무에서 사용됨c9ca469b-d77a-42e8-8084-7adff40…4. 프로젝트 방향이 처음과 달라질 때의 태도 중요한 관점 전환
가설과 다르게 흘러가는 것은 실패가 아니라 “발견”
“A가 원인일 줄 알았는데 아니었다” 데이터가 보여주는 새로운 패턴 수용
이때는이해관계자와 소통하며 방향 수정
→ 목적을 다시 확인하고 유연하게 재정렬c9ca469b-d77a-42e8-8084-7adff40…5. 실무 데이터 분석 흐름은 실제로 동일한가? 답: 거의 동일하다 기본 흐름 문제 정의 → EDA → 분석 → 해석 실무 예시 (요약) • 최근 3개월 특정 캠페인 이후 금리 상품 조기 해지율 15% 상승 • 특정 고객군에서 해지 집중 • 경쟁사 금리 인상 시점과 해지 시점이 일치 •금리 민감 고객군이 전체 해지의 70% 차지 • → 고위험 고객 대상 타겟 마케팅 / 상품 조건 조정 (예상 방어 매출 수억 원)c9ca469b-d77a-42e8-8084-7adff40…6. 데이터 선택 & 난이도에 대한 오해 6-1. “재미있는 주제”가 중요
이해 없는 분석 = 그냥 AI 실행
몰입 가능한 주제가 인사이트 품질을 결정
6-2. 데이터 난이도는 우선순위 아님
데이터가 아니라문제와 가치가 먼저
난이도는 목적에 따라 자연히 결정됨
6-3. 고난이도 기술 ≠ 취업 직결 • 대시보드·집계로 충분한 경우도 많음 • “적절한 분석 선택”이 진짜 고급 역량c9ca469b-d77a-42e8-8084-7adff40…7. 데이터가 복잡할 때의 실무 전략 • “복잡하다”는 말 자체가 추상적 컬럼이 많은가? 비정형 데이터가 섞였는가? 이미지/좌표 데이터인가? 대응 전략