뉴스레터 가입하기

이 양식을 작성하려면 브라우저에서 JavaScript를 활성화하십시오.
가입경로
여기에 입력해주세요.
Edit Template

통계분석의 첫걸음, 카이제곱 검정 쉽게 이해하기

연구를 진행하다 보면 어느 순간 이런 의문을 만나게 됩니다.

  • 남성과 여성은 특정 서비스에 대한 만족도가 다를까
  • 방문 목적이 다른 사람들은 재방문 의향도 달라질까

이처럼 두 범주형 변수 사이에 연관성이 있는지 확인할 때 가장 기본적으로 활용되는 분석 방법이 바로 카이제곱 검정입니다.
SPSS에서는 교차분석과 함께 가장 자주 사용되는 기법이죠.


카이제곱 검정이란 무엇인가

카이제곱 검정은 명목 또는 순서 척도로 측정된 데이터에 적용하는 비모수 검정입니다.
쉽게 말하면

두 범주형 변수 사이에 관계가 존재하는지
또는 여러 집단의 분포가 동일한지를 따져보는 분석법

이라고 할 수 있어요.

✔ 주요 활용 목적

  • 독립성 판단
    두 변수가 서로 관련 있는지 확인
    예) 학과에 따라 선호하는 직업군이 달라질까
  • 동질성 판단
    여러 집단이 동일한 분포를 갖고 있는지 비교
    예) 지역별 특정 후보에 대한 지지율이 같은가

카이제곱 검정은
각 범주에서 실제로 관측된 빈도
관계가 없다고 가정했을 때 예상되는 빈도(기대값)
이 얼마나 차이가 큰지를 검정합니다.
차이가 크다면 두 변수는 연관성이 있다고 판단합니다.


SPSS에서 카이제곱 검정 진행하기

01 범주형 변수 두개를 준비
변수는 명목형 또는 순서형으로 설정

02 메뉴 선택
상단 메뉴에서 분석 → 기술통계 → 교차분석 실행

03 행과 열에 변수 배치
기준이 되는 변수를 행에, 비교 대상 변수를 열에 넣는 것이 보통 해석에 편합니다

04 옵션 설정

  • 통계량에서 카이제곱 선택
  • 셀 보기에서 관측빈도와 기대빈도 표시
  • 퍼센트는 행이나 열 기준으로 선택

05 확인 클릭
→ 교차표와 카이제곱 결과가 출력됩니다


결과 해석은 이렇게

  1. 교차표를 통해 각 범주별 관측값과 기대값의 차이를 한눈에 확인합니다
  2. 아래의 카이제곱 검정 결과 표에서 p값을 봅니다
  • p값이 0.05 이상 → 유의미하지 않음
    두 변수는 독립적, 관계 없음
  • p값이 0.05 미만 → 유의미한 차이 존재
    두 변수는 독립적이지 않음, 즉 연관성 있음

반드시 확인해야 할 점

카이제곱 검정에는 한 가지 중요한 조건이 있습니다.

기대 빈도가 5 미만인 셀이 너무 많으면 결과를 신뢰하기 어렵습니다

일반 기준

  • 기대값 5 미만 셀이 전체의 20%를 넘지 않도록
  • 기대값 1 미만 셀이 없어야 함

이를 만족하지 못하면
피셔 정확 검정 등 대체 방법을 고려해야 합니다.


마무리

범주형 변수의 관계를 파악하는 방법 중
가장 간단하면서도 폭넓게 활용되는 분석법이
바로 카이제곱 검정입니다.

데이터만 잘 준비하면
서비스 개선, 고객 인사이트 분석, 정책 수립 등
다양한 영역에서 의미 있는 결론을 도출할 수 있어요.

연구 설계 단계에서부터
어떤 변수를 비교하고 어떤 범주로 구분할 것인지
차근차근 준비해보시길 바랍니다.
앞으로의 통계분석이 훨씬 수월해질 거예요!

K-Grad​

한국 대학원생 협회에서는 대학원생들을 위한 수많은 정보와 혜택, 그리고 강의를 제공합니다.

Features

Most Recent Posts

무료회원가입

무료회원가입 후 혜택받으세요!

Category

대학원생을 위한 유일한 협회!

Help

Copyright

Privacy Policy

Mailing List

© 2023 Created with K-GRAD