SPSS에서 판별분석을 실행하는 과정 자체는 어렵지 않습니다.
하지만 막상 결과를 열어보면 여러 개의 표가 한꺼번에 출력되고,
어디서부터 해석해야 할지 막막해지는 경우가 많습니다.
판별분석은 결과표의 수가 많은 분석입니다.
따라서 모든 표를 다 보려 하기보다는,
논문에서 반드시 확인하고 보고해야 하는 핵심 지점만 순서대로 검토하는 것이 중요합니다.
1. 분석 전제 확인: 공분산 행렬의 동일성
판별분석은 집단 간 공분산 구조가 유사하다는 가정을 전제로 합니다.
이를 검토하기 위해 가장 먼저 확인해야 할 표가 Box의 M 검정입니다.
Box의 M 검정 해석
- 유의확률이 .05 이상
→ 집단 간 공분산 행렬이 동일하다는 가정을 충족 - 유의확률이 .05 미만
→ 가정이 엄밀하게 충족되지는 않음
다만, 집단별 표본 수가 크게 차이나지 않는 경우에는
분석을 계속 진행하는 경우도 많습니다.
이 경우 논문에는 가정 위반 가능성을 명시하는 것이 일반적입니다.
2. 판별함수의 유의성 확인
전제 검토 이후에는
도출된 판별함수가 실제로 집단을 구분할 수 있는지를 확인합니다.
Wilks의 Lambda
Wilks의 Lambda는
판별함수가 집단 간 차이를 얼마나 설명하는지를 보여주는 지표입니다.
- p값이 .05 미만
→ 판별함수가 통계적으로 유의미
→ 집단 구분에 의미 있는 역할을 함
논문에서는 보통
“Wilks의 Lambda가 유의하게 나타나(p < .05), 판별함수가 집단을 유의미하게 구분하는 것으로 확인되었다”
와 같이 기술합니다.

3. 어떤 변수가 집단을 나누는가?
판별분석의 핵심 질문은
‘무엇이 집단을 구분하는가’입니다.
이를 확인하기 위해 두 개의 표를 함께 봅니다.
표준화 정준 판별함수 계수
- 각 독립변수가 판별함수에 기여하는 상대적 영향력
- 절대값이 클수록 영향력이 큼
- 방향(±)보다는 크기 중심으로 해석
구조행렬
- 각 독립변수와 판별함수 간 상관관계
- 일반적으로 |0.30| 이상이면 의미 있는 변수로 간주
실제 해석에서는
구조행렬을 중심으로 주요 판별 변수를 제시하고,
표준화 계수는 보조적으로 활용하는 것이 더 안정적입니다.
4. 분류 정확도 확인: 판별분석의 성능 평가
판별분석은 단순한 차이 검정이 아니라
분류 분석입니다.
따라서 분류 정확도는 반드시 보고해야 합니다.
분류 결과표 해석
- 전체 사례 중 올바르게 분류된 비율 확인
- 보통 70% 이상이면 실질적인 판별력이 있다고 평가
또한 교차 타당화 결과가 함께 제공된다면,
이를 기준으로 보고하는 것이 과적합을 피하는 데 더 적절합니다.
논문에서는
“교차 타당화 기준 분류 정확도는 XX%로 나타났다”
와 같이 서술하는 경우가 많습니다.
5. 논문 서술의 핵심 흐름
판별분석 결과는 다음 순서로 정리하면 깔끔합니다.
- 전제 조건(Box의 M) 검토
- 판별함수의 유의성(Wilks의 Lambda)
- 주요 판별 변수 제시(구조행렬 중심)
- 분류 정확도 보고
- 연구 목적과 연결된 해석 제시
예시 문장:
“판별분석 결과, 독립변수들은 집단을 통계적으로 유의미하게 구분하는 것으로 나타났다. 특히 ○○ 변수는 판별함수에 가장 크게 기여한 요인으로 확인되었다. 교차 타당화 기준 분류 정확도는 XX%로, 본 모형은 집단 분류에 있어 실질적인 판별력을 갖는 것으로 판단된다.”
판별분석에서 자주 발생하는 오류
- 구조행렬을 확인하지 않고 계수만 해석
- 분류 정확도를 제시하지 않음
- ‘집단 간 차이가 있다’ 수준에서 결론을 마무리
판별분석은
차이가 있는지보다
어떤 변수가, 어느 정도로, 얼마나 정확하게 구분하는지를 설명하는 분석입니다.

정리하며
- 판별분석은 결과표가 많아 해석 순서가 중요
- Box의 M → Wilks의 Lambda → 구조행렬 → 분류 정확도 순으로 검토
- 핵심은 집단 구분의 논리와 실질적 판별력 설명
판별분석은 단순한 통계 기법이 아니라,
여러 변수가 집단을 어떻게 나누는지를 구조적으로 보여주는 도구입니다.
표 하나하나에 매몰되기보다,
분석의 흐름과 연구 목적에 맞춘 해석을 중심으로 접근하시길 바랍니다.



