SPSS로 명목변수 처리하는 가장 확실한 방법
회귀분석을 하다 보면 꼭 마주치는 질문이 하나 있습니다.
“명목변수는 회귀분석에 어떻게 넣나요?”
답은 하나입니다.
더미변수(Dummy Variable)로 변환해서 사용해야 합니다.
회귀분석은 숫자의 증가·감소를 해석하는 분석이기 때문에
성별, 지역, 종교처럼 범주만 있는 변수는 그대로 사용할 수 없습니다.
그래서 명목변수를 0과 1로 바꿔 해석 가능한 형태로 만드는 과정이 필요하고,
그게 바로 더미변수입니다.
더미변수(Dummy Variable)란?
더미변수는 명목변수의 각 범주를 이진 변수(0/1)로 바꾼 것입니다.
- 1 : 해당 범주에 속함
- 0 : 해당 범주에 속하지 않음
예를 들어, 종교 변수가 다음과 같다고 해봅시다.
- 기독교 / 불교 / 천주교 / 무교 (4개 범주)
회귀분석에서는
“종교가 1만큼 증가한다”
같은 해석이 불가능합니다.
그래서 질문을 이렇게 바꿉니다.
- 기독교 대비 불교인가?
- 기독교 대비 천주교인가?
- 기독교 대비 무교인가?
이때 각각을 0과 1로 표현한 변수가 더미변수입니다.
SPSS에서 더미변수 만드는 방법
실무에서 가장 많이 쓰이는 방법은 변수를 직접 만들어서 데이터에 저장하는 방식입니다.
아래 두 가지 방법 중 하나만 익혀도 충분합니다.
방법 1. [다른 변수로 코딩 변경] 사용 (가장 권장)



① 메뉴 경로변환(T) → 다른 변수로 코딩 변경(R)
② 변수 선택 & 새 변수 이름 지정
- 더미로 만들 변수 선택 → 오른쪽으로 이동
- 출력 변수 이름 입력 (예:
religion_christian) - 반드시 [변경] 버튼 클릭
③ 기존값 / 새로운 값 설정
- 기존값: 해당 범주 값 (예: 기독교 = 1)
→ 새로운 값: 1 - 기존값: 기타 모든 값
→ 새로운 값: 0 - 각각
추가클릭
④ [계속] → [확인]
→ 더미변수 생성 완료
👉 이 과정을 반복해서 필요한 더미변수를 만듭니다.
방법 2. [변수 계산] 사용 (조건식에 익숙하다면)
① 메뉴 경로변환(T) → 변수 계산(C)
② 목표변수
- 새 변수명 입력 (예:
region_seoul)
③ 조건식 설정
- 조건 버튼 클릭
- 예:
region = 1(서울이 1로 코딩된 경우)
조건을 만족하면 1, 아니면 자동으로 0이 됩니다.

더미변수 만들 때 반드시 지켜야 할 원칙
① 범주 수 – 1개만 사용 (n − 1 규칙)
범주가 4개라면
👉 더미변수는 3개만 사용
나머지 1개는 기준범주(reference group) 가 됩니다.
⚠️ 모든 범주를 다 넣으면
→ 완전 다중공선성 발생
→ 회귀분석 자체가 무효
② 기준범주는 의미 있게 선택
기준범주는 해석의 출발점입니다.
다음 기준을 고려하세요.
- 가장 일반적인 집단
- 비교 기준이 되는 집단
- 표본 수가 가장 많은 집단
예시
“기독교 대비 불교는 유의미한 차이가 나타났다”
→ 해석은 항상 기준범주 대비입니다.

정리하면
- 더미변수는 명목변수를 회귀분석에 쓰기 위한 필수 장치
- SPSS에서는
- 다른 변수로 코딩 변경
- 변수 계산
두 방법으로 생성 가능
- 범주 수 – 1개만 투입
- 제외된 범주가 해석의 기준점
더미변수 생성 자체는 어렵지 않습니다.
하지만 기준범주 선택과 해석에서 오류가 나면
논문 심사에서 바로 지적받습니다.
실행보다 중요한 건
“이 더미변수가 무엇을 비교하고 있는가”를
연구자가 설명할 수 있는지입니다.
이 포인트만 기억해도 회귀분석에서 한 단계는 올라갑니다.



