종속변수가 범주형일 때 활용할 수 있는 분석은 로지스틱 회귀만 있는 것이 아닙니다.
이미 구분된 집단을 기준으로, 어떤 연속형 변수들이 그 집단을 구분하는 데 기여하는지를 보고 싶다면 판별분석(Discriminant Analysis)을 고려할 수 있습니다.
이번 글에서는 판별분석의 개념과 SPSS에서 실행하는 절차를 중심으로 정리해 보겠습니다.
판별분석의 기본 개념
판별분석은 미리 정의된 집단(범주형 종속변수)을 대상으로,
여러 개의 연속형 독립변수를 조합해 집단을 가장 잘 구분하는 판별함수를 도출하는 분석 방법입니다.
이 분석을 통해 다음과 같은 질문에 답할 수 있습니다.
- 어떤 변수 조합이 집단 간 차이를 가장 잘 설명하는가
- 각 변수는 집단 구분에 얼마나 기여하는가
- 새로운 사례는 어느 집단에 속할 가능성이 높은가
즉, 판별분석은
집단을 구분하는 수학적 규칙을 만들고, 그 규칙의 성능을 평가하는 분석이라고 이해할 수 있습니다.
변수 구성의 원칙
판별분석은 변수의 척도 조건이 비교적 명확합니다.
- 종속변수: 범주형(명목 척도)
- 예: 고객 유형, 구매 여부, A/B/C 집단
- 독립변수: 연속형(등간·비율 척도)
- 예: 만족도 점수, 소득 수준, 매출액, 이용 빈도
집단 간 평균 차이만 확인하고 싶다면 분산분석으로도 충분하지만,
분류 정확도와 판별력을 함께 보고 싶을 때 판별분석이 적합합니다.
집단이 두 개인 경우 이변량 판별분석,
세 개 이상인 경우 다변량 판별분석을 사용합니다.
판별분석이 적합한 연구 질문
판별분석은 다음과 같은 목적의 연구에서 자주 활용됩니다.
- 집단 분류 가능성 평가
- 특정 특성들이 집단을 얼마나 잘 예측하는가
- 핵심 판별 변수 탐색
- 여러 변수 중 집단 구분에 가장 중요한 요인은 무엇인가
- 집단 특성 구조 파악
- 각 집단을 설명하는 변수 조합은 어떤 형태를 가지는가
이처럼 판별분석은
단순 비교를 넘어 집단 구조를 설명하고 활용 가능성을 제시하는 분석입니다.
SPSS에서 판별분석 실행 절차
1. 메뉴 경로
분석 → 분류 → 판별분석
2. 집단 변수 설정
- 범주형 종속변수를 집단 변수로 지정
집단 변수를 투입한 뒤에는 반드시 범위 지정을 해야 합니다.
예를 들어
- 1 = 우수 고객
- 2 = 일반 고객
이라면 최소값은 1, 최대값은 2로 입력합니다.
이 단계가 누락되면 분석이 실행되지 않습니다.
3. 독립변수 투입
- 연속형 독립변수만 선택하여 투입
명목형 변수는 포함하지 않는 것이 원칙입니다.
4. 옵션 설정
통계량 옵션
다음 항목을 함께 선택하는 것이 일반적입니다.
- 집단별 평균
- 일변량 분산분석
- Box의 M 검정
Box의 M 검정은
판별분석의 전제 조건인 집단 간 공분산 행렬의 동일성을 확인하는 데 사용됩니다.
분류 옵션
- 사전확률: 모든 집단 동일
- 분류 결과 요약표 출력
이를 통해 최종 분류 정확도를 확인할 수 있습니다.
5. 분석 실행
설정을 마친 뒤 확인을 누르면
판별함수와 분류 결과가 출력됩니다.

핵심 정리
- 판별분석은 연속형 독립변수로 범주형 집단을 분류·예측하는 분석
- 집단 예측, 핵심 변수 파악, 집단 특성 규명에 활용 가능
- SPSS 실행 시 집단 변수 범위 지정과 옵션 설정이 중요
- 실행보다 중요한 것은 이후의 결과 해석



