연구를 진행하다 보면 어느 순간 이런 의문을 만나게 됩니다.
- 남성과 여성은 특정 서비스에 대한 만족도가 다를까
- 방문 목적이 다른 사람들은 재방문 의향도 달라질까
이처럼 두 범주형 변수 사이에 연관성이 있는지 확인할 때 가장 기본적으로 활용되는 분석 방법이 바로 카이제곱 검정입니다.
SPSS에서는 교차분석과 함께 가장 자주 사용되는 기법이죠.
카이제곱 검정이란 무엇인가
카이제곱 검정은 명목 또는 순서 척도로 측정된 데이터에 적용하는 비모수 검정입니다.
쉽게 말하면
두 범주형 변수 사이에 관계가 존재하는지
또는 여러 집단의 분포가 동일한지를 따져보는 분석법
이라고 할 수 있어요.
✔ 주요 활용 목적
- 독립성 판단
두 변수가 서로 관련 있는지 확인
예) 학과에 따라 선호하는 직업군이 달라질까 - 동질성 판단
여러 집단이 동일한 분포를 갖고 있는지 비교
예) 지역별 특정 후보에 대한 지지율이 같은가
카이제곱 검정은
각 범주에서 실제로 관측된 빈도와
관계가 없다고 가정했을 때 예상되는 빈도(기대값)
이 얼마나 차이가 큰지를 검정합니다.
차이가 크다면 두 변수는 연관성이 있다고 판단합니다.
SPSS에서 카이제곱 검정 진행하기
01 범주형 변수 두개를 준비
변수는 명목형 또는 순서형으로 설정
02 메뉴 선택
상단 메뉴에서 분석 → 기술통계 → 교차분석 실행
03 행과 열에 변수 배치
기준이 되는 변수를 행에, 비교 대상 변수를 열에 넣는 것이 보통 해석에 편합니다
04 옵션 설정
- 통계량에서 카이제곱 선택
- 셀 보기에서 관측빈도와 기대빈도 표시
- 퍼센트는 행이나 열 기준으로 선택
05 확인 클릭
→ 교차표와 카이제곱 결과가 출력됩니다
결과 해석은 이렇게
- 교차표를 통해 각 범주별 관측값과 기대값의 차이를 한눈에 확인합니다
- 아래의 카이제곱 검정 결과 표에서 p값을 봅니다
- p값이 0.05 이상 → 유의미하지 않음
두 변수는 독립적, 관계 없음 - p값이 0.05 미만 → 유의미한 차이 존재
두 변수는 독립적이지 않음, 즉 연관성 있음
반드시 확인해야 할 점
카이제곱 검정에는 한 가지 중요한 조건이 있습니다.
기대 빈도가 5 미만인 셀이 너무 많으면 결과를 신뢰하기 어렵습니다
일반 기준
- 기대값 5 미만 셀이 전체의 20%를 넘지 않도록
- 기대값 1 미만 셀이 없어야 함
이를 만족하지 못하면
피셔 정확 검정 등 대체 방법을 고려해야 합니다.

마무리
범주형 변수의 관계를 파악하는 방법 중
가장 간단하면서도 폭넓게 활용되는 분석법이
바로 카이제곱 검정입니다.
데이터만 잘 준비하면
서비스 개선, 고객 인사이트 분석, 정책 수립 등
다양한 영역에서 의미 있는 결론을 도출할 수 있어요.
연구 설계 단계에서부터
어떤 변수를 비교하고 어떤 범주로 구분할 것인지
차근차근 준비해보시길 바랍니다.
앞으로의 통계분석이 훨씬 수월해질 거예요!



