SPSS에서 판별분석을 실행하는 과정 자체는 비교적 단순합니다.
하지만 결과를 확인하는 순간, 여러 개의 표가 한꺼번에 출력되면서
“이걸 전부 다 해석해야 하나?”라는 고민이 생기기 쉽습니다.
판별분석은 실제로 확인해야 할 표가 많은 분석입니다.
그래서 무작정 위에서부터 읽기보다,
논문에서 반드시 보고해야 하는 핵심 지점만 정해진 순서로 확인하는 것이 중요합니다.
1. 분석 전제 점검: Box의 M 검정
판별분석의 첫 단계는
집단 간 공분산 구조가 유사하다는 가정이 충족되는지 확인하는 것입니다.
이를 위해 확인하는 표가 Box의 M 검정 결과입니다.
- p ≥ .05
→ 집단 간 공분산 행렬이 동일하다는 가정을 만족 - p < .05
→ 가정이 엄밀하게 충족되지 않음
다만, 집단별 표본 수가 크게 차이나지 않는 경우에는
분석을 그대로 진행하는 경우도 많습니다.
이때는 논문에 가정 위반 가능성을 명시해 주는 것이 일반적입니다.
2. 판별함수가 의미 있는가: Wilks의 Lambda
다음으로 확인해야 할 것은
도출된 판별함수가 실제로 집단을 구분할 수 있는지 여부입니다.
Wilks의 Lambda 해석
- p < .05
→ 판별함수가 통계적으로 유의미
→ 집단 구분에 기여함
논문에서는 보통 다음과 같이 정리합니다.
“Wilks의 Lambda가 유의하게 나타나(p < .05), 판별함수는 집단을 유의미하게 구분하는 것으로 확인되었다.”
이 단계까지가
‘판별분석을 해도 되는지’에 대한 통계적 근거 확인입니다.
3. 어떤 변수가 집단을 구분하는가
판별분석의 핵심은
“집단 간 차이가 있다”가 아니라
“무엇이 그 차이를 만들어내는가”입니다.
이를 위해 두 개의 표를 함께 확인합니다.
(1) 표준화 정준 판별함수 계수
- 각 독립변수가 판별함수에 미치는 상대적 영향력
- 절대값이 클수록 영향력이 큼
- 방향성보다는 크기 중심으로 해석
(2) 구조행렬
- 독립변수와 판별함수 간의 상관관계
- 일반적으로 |0.30| 이상이면 의미 있는 변수로 판단
실제 해석에서는
구조행렬을 중심으로 주요 판별 변수를 제시하는 것이 더 안정적입니다.
표준화 계수만 단독으로 해석하는 것은 흔한 오류 중 하나입니다.
4. 분류 정확도 확인: 판별분석의 성능 평가
판별분석은 예측과 분류를 목적으로 하는 분석이기 때문에
분류 정확도 보고는 필수입니다.
분류 결과표
- 전체 사례 중 올바르게 분류된 비율 확인
- 일반적으로 70% 이상이면 실질적인 판별력이 있다고 판단
또한 교차 타당화 결과가 제공된다면
이를 기준으로 정확도를 보고하는 것이
과적합을 피하는 데 더 적절합니다.
5. 논문에서의 결과 서술 흐름
판별분석 결과는 다음 순서로 정리하면 자연스럽습니다.
- Box의 M 검정 결과
- Wilks의 Lambda 유의성
- 주요 판별 변수(구조행렬 중심)
- 분류 정확도 제시
- 연구 목적과의 연결 해석
예시 문장:
“판별분석 결과, 독립변수들은 연구 대상 집단을 통계적으로 유의미하게 구분하는 것으로 나타났다. 구조행렬 분석 결과 ○○ 변수가 집단 판별에 가장 중요한 역할을 수행하였다. 교차 타당화 기준 분류 정확도는 XX%로, 본 모형은 집단 분류에 있어 실질적인 판별력을 갖는 것으로 판단된다.”

판별분석에서 자주 발생하는 해석 오류
- 구조행렬을 확인하지 않고 계수만 제시
- 분류 정확도를 누락
- ‘집단 간 차이가 있다’ 수준에서 해석 종료
판별분석은
차이를 확인하는 분석이 아니라
집단을 구분하는 구조와 정확도를 설명하는 분석입니다.
정리
- 판별분석은 결과표가 많아 해석 순서가 중요
- Box의 M → Wilks의 Lambda → 구조행렬 → 분류 정확도 순으로 검토
- 핵심은 “어떤 변수가 집단을 얼마나 잘 구분하는가”를 설명하는 것
판별분석의 가치는
숫자 자체가 아니라,
그 숫자가 집단 구분을 어떻게 설명해 주는지에 있습니다.
단계별 핵심 포인트를 중심으로 해석 연습을 이어가 보시길 바랍니다.



