해석 때문에 논문이 흔들리는 이유
논문을 쓰다 보면 상관분석은 거의 빠지지 않습니다.
변수 간 관계를 빠르게 파악할 수 있고, SPSS에서도 몇 번 클릭이면 결과가 나오니까요.
하지만 심사 의견을 보면 이런 문장이 자주 등장합니다.
- “상관분석 결과의 해석이 부적절함”
- “상관계수를 인과관계로 오해하고 있음”
- “상관관계의 강도에 대한 논의가 부족함”
즉, 문제는 분석이 아니라 해석과 보고 방식입니다.
이번 글에서는 상관분석을 어떻게 돌리느냐보다,
어디까지 말할 수 있고, 어디서 멈춰야 하는지에 초점을 맞춰 정리해볼게요.
1. 상관분석의 출발점은 ‘계수 선택’이다
상관분석에서 가장 먼저 결정해야 할 것은
피어슨(Pearson)인지, 스피어만(Spearman)인지입니다.
이 선택이 틀리면, 뒤에 나오는 r값은 아무 의미가 없어질 수 있어요.
✔ 피어슨 상관계수는 언제 쓰나?
- 연속형 변수(등간·비율)
- 리커트 척도를 등간척도로 가정한 경우
- 정규성 가정이 크게 문제되지 않을 때
👉 논문에서 가장 흔하게 사용됨
✔ 스피어만 상관계수는 언제 쓰나?
- 순위 데이터, 서열 척도
- 분포가 심하게 비대칭적일 때
- 극단값(이상치)의 영향이 큰 경우
👉 “안전한 선택지”로 많이 사용됨
📌 중요한 포인트
정규성 검정에서 p<.05가 나왔다고 해서 논문이 망하는 건 아닙니다.
다만 그 경우, 피어슨을 고집하는 이유가 없다면 스피어만이 더 설득력 있습니다.
2. SPSS에서는 왜 ‘양측 검정’이 기본일까?
SPSS에서 상관분석을 실행하면 기본값이 양측 검정(Two-tailed) 입니다.
이건 우연이 아니라, 학술 연구의 기본 전제 때문이에요.
왜 단측이 아니라 양측일까?
대부분의 연구는
“양의 상관일 것이다” 혹은 “음의 상관일 것이다”
를 사전에 단정하지 않기 때문입니다.
즉, 우리는 보통
- 관계가 있는지 없는지
- 0이 아닌지를
검정합니다.
그래서 특별한 이론적 근거 없이 단측 검정을 쓰면
👉 유의확률을 낮추기 위한 선택으로 오해받기 쉽습니다.
📌 단측 검정을 쓰고 싶다면
- 방향성이 명확한 이론
- 선행연구의 일관된 결과를 반드시 제시해야 합니다.

3. 상관분석 해석에서 가장 많이 무너지는 3가지 지점
❌ 1) “상관이 있으니 영향을 미친다”는 표현
이건 정말 많이 나오는 오류입니다.
상관분석이 말해주는 건 단 하나입니다.
두 변수가 함께 변하는 경향이 있다
그 이상도, 그 이하도 아닙니다.
✔ 허용되는 표현
- “정적 상관관계가 나타났다”
- “유의한 상관을 보였다”
❌ 피해야 할 표현
- “A가 B에 영향을 미친다”
- “A로 인해 B가 증가한다”
📌 인과관계는
- 회귀분석
- 실험 설계
- 종단 자료
에서나 논의할 수 있습니다.
❌ 2) p값만 보고 r값을 무시하는 해석
표본 수가 크면,
거의 모든 상관이 유의하게 나옵니다.
그래서 논문에서는
“유의하다”보다
“얼마나 강한가”가 더 중요합니다.
일반적으로 많이 쓰이는 기준은 다음과 같습니다.
- r ≈ .10 → 매우 약함
- r ≈ .30 → 중간 수준
- r ≥ .50 → 강한 관계
📌 예시
r = .11, p < .001
→ “통계적으로 유의하지만, 실질적 영향력은 매우 제한적”
이 한 문장 차이가 심사에서 큰 차이를 만듭니다.
❌ 3) 선형 관계라는 가정을 확인하지 않음
피어슨 상관계수는 직선 관계를 전제로 합니다.
그런데 두 변수 관계가
- U자형
- 역U자형
- 곡선형
이라면?
👉 r값은 0에 가까워질 수 있습니다.
(관계가 없어서가 아니라, 형태가 다르기 때문에)
📌 그래서 상관분석 후에는 반드시
- 산점도(scatter plot)를 확인해야 합니다.
곡선 패턴이 보인다면
→ 상관분석 결과만으로 결론 내리면 안 됩니다.
4. 논문에서 상관분석을 ‘안전하게’ 쓰는 방법
논문에서 상관분석은 보통
- 변수 간 기본 관계 제시
- 회귀분석 전 사전 탐색
용도로 사용됩니다.
그래서 다음 원칙을 지키면 안전합니다.
✔ 인과 표현은 철저히 배제
✔ p값과 r값을 함께 보고
✔ “강도”를 반드시 언급
✔ 산점도 확인 여부를 언급하면 더 좋음
정리하며
상관분석은 가장 쉬운 분석 중 하나이지만,
가장 쉽게 오해되는 분석이기도 합니다.
- 상관은 설명이지, 증명이 아니다
- 유의성은 시작이지, 결론이 아니다
- 숫자보다 중요한 건 해석의 범위다
상관분석을 “돌렸다”에서 끝내지 말고,
어디까지 말할 수 있는 분석인지 정확히 알고 쓰는 것이
논문의 신뢰도를 지키는 가장 좋은 방법입니다.



