— K-means vs 계층적 군집, 논문에서 어떻게 쓰일까
논문을 보다 보면 이런 분석이 나옵니다.
👉 “군집분석 결과, 3개의 집단으로 구분되었다”
처음 보면 어렵게 느껴집니다.
- 이건 언제 쓰는 거지?
- 왜 나누는 거지?
근데 핵심은 간단합니다.
👉 비슷한 사람끼리 묶는 분석입니다
1️⃣ 군집분석은 언제 쓰는가
군집분석은 이런 상황에서 사용합니다.
👉 “집단이 미리 정해져 있지 않을 때”
예:
- 고객 유형 분류
- 이용자 특성 구분
- 행동 패턴 그룹화
👉 스스로 그룹을 만들어내는 분석

2️⃣ 가장 많이 쓰는 2가지 방법
논문에서는 보통 이 두 가지 사용합니다.
✔ ① K-means 군집분석
👉 가장 많이 사용
특징:
- 집단 개수 미리 설정
- 빠르고 간단
- 실무/논문 둘 다 많이 사용
✔ 예 → “3개 집단으로 나눔”
✔ ② 계층적 군집분석
👉 구조 먼저 보는 용도
특징:
- 자동으로 군집 구조 생성
- 덴드로그램(나무형 그래프) 생성
👉 몇 개로 나눌지 판단할 때 사용
3️⃣ 보통 이렇게 같이 사용합니다
👉 가장 많이 쓰는 방식
1️⃣ 계층적 군집
→ 집단 수 확인
2️⃣ K-means
→ 실제 분석 진행
👉 이 조합이 정석입니다

4️⃣ 군집 수는 어떻게 정하냐
이게 핵심입니다.
👉 기준
- 덴드로그램
- 거리 변화
- 해석 가능성
👉 숫자보다 중요한 건
👉 설명 가능한가
5️⃣ 군집 해석 방법
군집분석은 결과보다
👉 해석이 핵심입니다
✔ 예
- 군집 1: 만족도 높음 + 스트레스 낮음
→ “안정형” - 군집 2: 만족도 낮음 + 스트레스 높음
→ “위험형”
👉 이렇게 이름 붙여야 합니다

6️⃣ 사람들이 많이 틀리는 부분
❌ 군집 수 그냥 정함
👉 근거 없음 → 바로 지적
❌ 해석 없음
👉 숫자만 나열 → 의미 없음
❌ 변수 선택 이상
👉 관련 없는 변수 포함 → 결과 왜곡
7️⃣ 논문에서는 이렇게 쓰면 됩니다
✔ 예문
군집분석 결과, 응답자는 3개의 집단으로 구분되었으며, 각 집단은 변수 특성에 따라 서로 다른 패턴을 보였다.

🔥 핵심 정리
군집분석은
👉 데이터를 나누는 게 아니라
👉 의미를 만드는 분석입니다
👀 교수님이 보는 포인트
- 군집 수 근거
- 변수 선택
- 집단 해석
👉 이 3개

🎯 결론
👉 군집분석은 이름 붙이기 싸움입니다



