뉴스레터 가입하기

이 양식을 작성하려면 브라우저에서 JavaScript를 활성화하십시오.
가입경로
여기에 입력해주세요.
Edit Template

상관분석, 돌리는 건 쉬운데

해석 때문에 논문이 흔들리는 이유

논문을 쓰다 보면 상관분석은 거의 빠지지 않습니다.
변수 간 관계를 빠르게 파악할 수 있고, SPSS에서도 몇 번 클릭이면 결과가 나오니까요.

하지만 심사 의견을 보면 이런 문장이 자주 등장합니다.

  • “상관분석 결과의 해석이 부적절함”
  • “상관계수를 인과관계로 오해하고 있음”
  • “상관관계의 강도에 대한 논의가 부족함”

즉, 문제는 분석이 아니라 해석과 보고 방식입니다.
이번 글에서는 상관분석을 어떻게 돌리느냐보다,
어디까지 말할 수 있고, 어디서 멈춰야 하는지에 초점을 맞춰 정리해볼게요.


1. 상관분석의 출발점은 ‘계수 선택’이다

상관분석에서 가장 먼저 결정해야 할 것은
피어슨(Pearson)인지, 스피어만(Spearman)인지입니다.

이 선택이 틀리면, 뒤에 나오는 r값은 아무 의미가 없어질 수 있어요.

✔ 피어슨 상관계수는 언제 쓰나?

  • 연속형 변수(등간·비율)
  • 리커트 척도를 등간척도로 가정한 경우
  • 정규성 가정이 크게 문제되지 않을 때

👉 논문에서 가장 흔하게 사용됨

✔ 스피어만 상관계수는 언제 쓰나?

  • 순위 데이터, 서열 척도
  • 분포가 심하게 비대칭적일 때
  • 극단값(이상치)의 영향이 큰 경우

👉 “안전한 선택지”로 많이 사용됨

📌 중요한 포인트
정규성 검정에서 p<.05가 나왔다고 해서 논문이 망하는 건 아닙니다.
다만 그 경우, 피어슨을 고집하는 이유가 없다면 스피어만이 더 설득력 있습니다.


2. SPSS에서는 왜 ‘양측 검정’이 기본일까?

SPSS에서 상관분석을 실행하면 기본값이 양측 검정(Two-tailed) 입니다.
이건 우연이 아니라, 학술 연구의 기본 전제 때문이에요.

왜 단측이 아니라 양측일까?

대부분의 연구는

“양의 상관일 것이다” 혹은 “음의 상관일 것이다”
사전에 단정하지 않기 때문입니다.

즉, 우리는 보통

  • 관계가 있는지 없는지
  • 0이 아닌지를
    검정합니다.

그래서 특별한 이론적 근거 없이 단측 검정을 쓰면
👉 유의확률을 낮추기 위한 선택으로 오해받기 쉽습니다.

📌 단측 검정을 쓰고 싶다면

  • 방향성이 명확한 이론
  • 선행연구의 일관된 결과를 반드시 제시해야 합니다.

3. 상관분석 해석에서 가장 많이 무너지는 3가지 지점

❌ 1) “상관이 있으니 영향을 미친다”는 표현

이건 정말 많이 나오는 오류입니다.

상관분석이 말해주는 건 단 하나입니다.

두 변수가 함께 변하는 경향이 있다

그 이상도, 그 이하도 아닙니다.

✔ 허용되는 표현

  • “정적 상관관계가 나타났다”
  • “유의한 상관을 보였다”

❌ 피해야 할 표현

  • “A가 B에 영향을 미친다”
  • “A로 인해 B가 증가한다”

📌 인과관계는

  • 회귀분석
  • 실험 설계
  • 종단 자료
    에서나 논의할 수 있습니다.

❌ 2) p값만 보고 r값을 무시하는 해석

표본 수가 크면,
거의 모든 상관이 유의하게 나옵니다.

그래서 논문에서는

“유의하다”보다
“얼마나 강한가”가 더 중요합니다.

일반적으로 많이 쓰이는 기준은 다음과 같습니다.

  • r ≈ .10 → 매우 약함
  • r ≈ .30 → 중간 수준
  • r ≥ .50 → 강한 관계

📌 예시

r = .11, p < .001
→ “통계적으로 유의하지만, 실질적 영향력은 매우 제한적”

이 한 문장 차이가 심사에서 큰 차이를 만듭니다.


❌ 3) 선형 관계라는 가정을 확인하지 않음

피어슨 상관계수는 직선 관계를 전제로 합니다.

그런데 두 변수 관계가

  • U자형
  • 역U자형
  • 곡선형
    이라면?

👉 r값은 0에 가까워질 수 있습니다.
(관계가 없어서가 아니라, 형태가 다르기 때문에)

📌 그래서 상관분석 후에는 반드시

  • 산점도(scatter plot)를 확인해야 합니다.

곡선 패턴이 보인다면
→ 상관분석 결과만으로 결론 내리면 안 됩니다.


4. 논문에서 상관분석을 ‘안전하게’ 쓰는 방법

논문에서 상관분석은 보통

  • 변수 간 기본 관계 제시
  • 회귀분석 전 사전 탐색
    용도로 사용됩니다.

그래서 다음 원칙을 지키면 안전합니다.

✔ 인과 표현은 철저히 배제
✔ p값과 r값을 함께 보고
✔ “강도”를 반드시 언급
✔ 산점도 확인 여부를 언급하면 더 좋음


정리하며

상관분석은 가장 쉬운 분석 중 하나이지만,
가장 쉽게 오해되는 분석이기도 합니다.

  • 상관은 설명이지, 증명이 아니다
  • 유의성은 시작이지, 결론이 아니다
  • 숫자보다 중요한 건 해석의 범위다

상관분석을 “돌렸다”에서 끝내지 말고,
어디까지 말할 수 있는 분석인지 정확히 알고 쓰는 것이
논문의 신뢰도를 지키는 가장 좋은 방법입니다.

K-Grad​

한국 대학원생 협회에서는 대학원생들을 위한 수많은 정보와 혜택, 그리고 강의를 제공합니다.

Features

Most Recent Posts

무료회원가입

무료회원가입 후 혜택받으세요!

Category

대학원생을 위한 유일한 협회!

Help

Copyright

Privacy Policy

Mailing List

© 2023 Created with K-GRAD