논문에서 변수 간 ‘관계’를 가장 먼저 확인하는 방법
논문을 쓰다 보면 거의 반드시 마주치는 질문이 있습니다.
“이 두 변수는 서로 관련이 있는가?”
예를 들어
- 고객 만족도가 높을수록 재구매 의도도 높아지는지
- 스트레스 수준이 높을수록 삶의 만족도는 낮아지는지
이처럼 두 변수 간 관계의 방향과 강도를 가장 먼저 점검할 때 사용하는 분석이 바로
상관분석(Correlation Analysis) 입니다.
상관분석은 회귀분석이나 구조방정식처럼 복잡한 모형에 들어가기 전,
연구의 기초 체력 점검 같은 역할을 합니다.
1. 상관분석은 언제 쓰는 분석일까?
상관분석은 “원인–결과”를 밝히는 분석이 아닙니다.
대신 변수들이 함께 움직이는 경향이 있는지를 확인합니다.
논문에서 상관분석이 주로 사용되는 상황은 다음과 같습니다.
① 변수 간 관계 탐색
- 연구 초기 단계에서 변수들이 서로 연관되어 있는지 확인
- 예: 자기효능감과 학업 성취도의 관계
② 회귀분석 전 점검
- 독립변수들 간 상관이 지나치게 높으면 다중공선성 문제 발생
- 일반적으로 r ≥ .80 이상이면 주의 필요
③ 척도 타당성의 보조 근거
- 이론적으로 유사한 개념 간 상관이 적절히 나타나는지 확인
- 예: 만족도와 충성도 간 상관
📌 중요한 포인트
상관분석 결과는 본 분석의 근거 자료이지,
그 자체로 연구의 결론이 되지는 않습니다.
2. 상관계수 해석의 기본 틀
상관계수는 -1에서 +1 사이의 값을 가집니다.
- +값: 한 변수가 증가할수록 다른 변수도 증가 (정적 상관)
- -값: 한 변수가 증가할수록 다른 변수는 감소 (부적 상관)
- 0에 가까움: 선형적 관계 거의 없음
절댓값이 클수록 관계의 강도가 크다고 해석합니다.
3. 피어슨 vs 스피어만, 선택 기준은 딱 두 가지

상관분석에서 가장 많이 헷갈리는 부분이
“피어슨을 써야 할까, 스피어만을 써야 할까?” 입니다.
이때 기준은 단 두 가지입니다.
✔ 변수의 척도
✔ 데이터의 분포 형태
피어슨 상관계수 (Pearson’s r)
- 등간·비율 척도의 연속형 변수
- 정규분포를 가정
- 두 변수의 선형 관계를 측정
- 논문에서 가장 널리 사용됨
👉 리커트 척도(5점·7점)를 사용하는 설문 연구에서
표본 수가 충분하다면(보통 n ≥ 30), 피어슨을 사용하는 경우가 많습니다.
스피어만 상관계수 (Spearman’s ρ)
- 서열(순위) 척도
- 비정규 분포 데이터
- 이상치 영향이 큰 경우
- 단조 관계만 있으면 적용 가능
👉 정규성 검정 결과가 명확히 깨졌거나,
변수 자체가 순위 개념이라면 스피어만이 더 안전합니다.
4. 리커트 척도는 항상 피어슨을 써도 될까?
많은 대학원생이 가장 헷갈려하는 지점입니다.
✔ 원칙적으로 리커트 척도는 서열 척도
✔ 그러나 사회과학 연구에서는 등간 척도로 가정하고
피어슨 상관분석을 사용하는 경우가 매우 많습니다.
다만,
- 표본 수가 매우 적거나
- 분포가 극단적으로 치우쳤거나
- 정규성 검정에서 명확히 p < .05로 깨졌다면
👉 스피어만을 선택하는 것이 심사에서 더 안전합니다.

5. 논문에서 꼭 기억해야 할 한 문장
상관분석을 쓸 때, 이 문장 하나만 기억해도 큰 실수를 피할 수 있습니다.
상관관계는 인과관계가 아니다.
논문에서 허용되는 표현은
- “유의한 상관관계가 나타났다” 까지입니다.
❌ “A가 B에 영향을 미친다”
❌ “A로 인해 B가 증가한다”
이런 문장은 회귀분석 이후에나 쓸 수 있습니다.
정리하면
- 상관분석은 변수 간 관계를 탐색하는 기초 분석
- 피어슨 vs 스피어만 선택 기준은 척도 + 분포
- 리커트 척도라도 상황에 따라 선택이 달라질 수 있음
- 상관은 설명이지, 인과 증명이 아님
상관분석은 정말 간단한 분석처럼 보이지만,
해석을 어떻게 하느냐에 따라 논문의 신뢰도가 크게 갈립니다.
“돌릴 줄 안다”보다
“어디까지 말할 수 있는지 안다”가 훨씬 중요합니다.



