종속변수가 범주형일 때 활용할 수 있는 분석 방법은 생각보다 다양합니다.
로지스틱 회귀분석이 가장 많이 알려져 있지만, 집단을 얼마나 명확하게 구분할 수 있는지에 초점을 두고 싶다면
판별분석(Discriminant Analysis)도 중요한 선택지가 됩니다.
이번 글에서는 판별분석의 개념과 SPSS에서 실행하는 방법을 중심으로 정리해 보겠습니다.
판별분석이란 무엇인가
판별분석은 이미 구분되어 있는 집단을 기준으로,
여러 개의 연속형 독립변수를 활용해 집단을 가장 잘 나누는 조합을 찾는 분석 방법입니다.
핵심 질문은 다음과 같습니다.
- 어떤 변수들이 집단 간 차이를 만들어내는가
- 이 변수 조합으로 집단을 얼마나 정확하게 분류할 수 있는가
- 새로운 사례가 어느 집단에 속할 가능성이 높은가
즉, 판별분석은
‘집단을 구분하는 공식(판별함수)’을 만들고 그 성능을 검증하는 분석이라고 이해할 수 있습니다.
변수 구성의 기본 조건
판별분석은 변수의 척도 조건이 비교적 명확합니다.
- 종속변수: 범주형(명목 척도)
- 예: 고객 유형, 구매/비구매, 집단 A·B·C 등
- 독립변수: 연속형(등간·비율 척도)
- 예: 만족도 점수, 소득 수준, 이용 빈도 등
집단 간 평균 차이만 보고 싶다면 분산분석으로도 충분하지만,
분류 정확도와 판별력을 함께 보고 싶다면 판별분석이 적합합니다.
집단이 2개라면 이변량 판별분석,
3개 이상이라면 다변량 판별분석을 사용합니다.
판별분석이 활용되는 연구 주제 예시
판별분석은 다음과 같은 연구 목적에 자주 사용됩니다.
- 집단 예측
- 어떤 특성들이 우수 고객과 일반 고객을 구분하는가
- 핵심 구분 변수 확인
- 여러 변수 중 집단을 가장 잘 나누는 요인은 무엇인가
- 집단 특성 구조 파악
- 각 집단을 설명하는 변수 조합은 어떤 형태를 띠는가
이처럼 판별분석은
단순 비교를 넘어 집단 구조를 설명하고 예측하는 분석에 적합합니다.

SPSS에서 판별분석 실행하기
1. 메뉴 경로
분석 → 분류 → 판별분석
2. 집단 변수 지정
- 범주형 종속변수를 집단 변수로 투입
이 단계에서 반드시 해야 할 작업이 있습니다.
범위 지정
집단 변수를 넣은 뒤,
해당 변수의 최소값과 최대값을 직접 입력해야 합니다.
예를 들어
- 1 = 우수 고객
- 2 = 일반 고객
이라면
최소값은 1, 최대값은 2로 지정합니다.
이 과정을 생략하면 분석이 실행되지 않습니다.
3. 독립변수 투입
- 연속형 독립변수들을 선택하여 투입
판별분석에서는 독립변수의 척도 조건이 중요하므로
명목형 변수는 포함하지 않는 것이 원칙입니다.
4. 옵션 설정
통계량 설정
다음 항목을 함께 선택하는 것이 일반적입니다.
- 집단별 평균
- 일변량 분산분석
- Box의 M 검정
Box의 M은
판별분석의 주요 전제 조건인
집단 간 공분산 행렬의 동일성을 검정하는 지표입니다.
분류 옵션
- 사전확률: 모든 집단 동일
- 분류 결과 요약표 출력
이를 통해
실제 분류 정확도와 예측 성능을 확인할 수 있습니다.
5. 분석 실행
모든 설정을 마친 뒤 확인을 누르면
판별함수와 분류 결과가 출력됩니다.

정리하면
- 판별분석은 연속형 독립변수로 범주형 집단을 분류·예측하는 분석
- 집단 간 차이뿐 아니라 분류 정확도까지 함께 평가 가능
- SPSS 실행 시 집단 변수 범위 지정과 옵션 설정이 핵심
- 해석의 중심은 “어떤 변수가 집단을 얼마나 잘 구분하는가”에 있음
판별분석은 실행 자체는 비교적 단순하지만,
어떤 변수가 판별력을 가지는지,
분류 정확도가 충분한지를 해석하는 과정이 무엇보다 중요합니다.
다음 글에서는
판별함수 계수, 구조행렬, 분류 정확도를 중심으로
판별분석 결과 해석 방법을 자세히 정리해 보겠습니다.



