이진 종속변수를 다루는 분석 중
로지스틱 회귀는 가장 활용도가 높은 기법입니다.
하지만 결과표를 단순히 보고 작성하면
논문 심사에서 지적될 가능성이 높은 실수들이 존재합니다.
아래 항목들은 반드시 점검하는 것이 좋습니다.
1. 기준 범주 설정을 정확하게 확인
로지스틱 회귀는
어떤 범주를 기준으로 삼느냐에 따라
계수 해석 방향이 달라집니다.
SPSS는 일반적으로
값이 작은 범주를 기준으로 설정합니다
예: 0을 기준으로 하여 1의 발생 확률을 예측하는 형태
따라서 코딩 내용을 명확히 정리해야 합니다
- 변수는 이진 형태로 더미화하였음
- 기준 범주가 무엇인지 명시
- 필요하면 옵션에서 기준 범주를 직접 지정
해석 방향이 바뀌면
결론과 논지 전체가 흔들릴 수 있습니다.
2. Exp(B)의 의미를 잘못 쓴 사례 주의
Exp(B)는
변화 비율이 아니라
오즈 비를 의미합니다.
- Exp(B) = 1 이상
오즈 증가 방향 - Exp(B) = 1 이하
오즈 감소 방향
증감률로 오해하여
잘못된 문장을 쓰지 않도록 주의가 필요합니다.
Exp(B)는 로그 오즈를 지수 변환한 값이라는 점에서
해석 논리를 세우면 오류를 방지할 수 있습니다.
3. 적합도 평가는 여러 지표를 함께 사용
Hosmer–Lemeshow 검정 결과만으로
모형 적합 여부를 판단하기는 어렵습니다.
표본이 커질수록
유의하게 나오기 쉬운 특성이 있기 때문입니다.
다음 지표를 함께 보고 판단해야 합니다
-2 Log Likelihood
Cox and Snell R제곱
Nagelkerke R제곱
분류 정확도
민감도와 특이도 확인 여부
적합도 평가를 다각적으로 수행하는 것이
논문 완성도를 높여줍니다.
4. 공선성 문제는 별도로 점검
로지스틱 회귀는
선형회귀 대신 사용되지만
독립변수 간 공선성은 그대로 영향을 줍니다.
공선성 지표는 SPSS 로지스틱 결과에 포함되어 있지 않기 때문에
선형회귀 분석창을 활용하여 확인해야 합니다
- VIF 10 미만
- Tolerance 0.1 이상
공선성이 있으면
계수가 불안정해지고
p값 해석도 달라질 수 있으므로
검토가 필요합니다.
5. 사건수 확보가 분석 신뢰도를 좌우
종속변수의 값이 1 또는 사건에 해당하는 사례 수가
충분해야 합니다.
일반적으로 사용하는 기준은 다음과 같습니다
EPV Event Per Variable 10 이상
즉, 사건 발생 건수 대비 투입된 독립변수 개수 고려
사건수가 부족하면
결과가 과도하게 민감하게 나타나고
추정값이 불안정할 가능성이 큽니다.

정리
로지스틱 회귀는 결과표만 보고
단편적인 해석을 적용하기 쉬운데
아래 요소는 반드시 확인해야 합니다
- 기준 범주 설정
- Exp(B) 해석 방식
- 적합도 지표 복수 검토
- 공선성 점검
- 적정 사건수 확보
분석을 실행하는 것보다
해석의 정확성을 확보하는 것이
연구에서 더 중요한 요소입니다.
로지스틱 회귀는 특히
해석 단계에서 사고 과정이 명확해야 하므로
해당 점검 목록을 활용해 결과를 정리해보시기 바랍니다.



