회귀분석 결과를 보고
가장 먼저 확인하는 값 중 하나가 있습니다.
👉 R² (설명력)
그런데 이 값이 낮게 나오면
많은 분들이 바로 이렇게 생각합니다.
“이거 모델 잘못된 거 아닌가요?”
“이걸로 논문 써도 되는 건가요?”
1️⃣ R²란?

R²는 간단히 말하면
👉 독립변수가 종속변수를 얼마나 설명하는지를 나타내는 지표입니다.
예:
- R² = 0.6 → 60% 설명
- R² = 0.2 → 20% 설명
👉 그래서 숫자가 낮으면
불안해지는 게 자연스럽습니다
2️⃣ 낮다고 해서 나쁜 건 아닙니다
많이 하는 오해입니다.
👉 “R² 낮으면 모델이 틀렸다” ❌
실제로는 연구 주제에 따라 R²는 원래 낮을 수 있습니다.
3️⃣ 특히 이런 연구는 R²가 낮게 나옵니다

✔ 인간 행동 / 심리 연구
✔ 설문 기반 사회과학 연구
✔ 복잡한 외부 요인이 많은 경우
👉 이런 경우 R²가 낮은 게 오히려 자연스러운 결과
4️⃣ 중요한 건 ‘유의성’과 ‘방향성’
논문에서 더 중요한 건
👉 변수 간 관계가 유의한지
👉 방향이 이론과 맞는지
👉 R²는 보조 지표일 뿐
5️⃣ 반대로 높은 R²도 무조건 좋은 건 아닙니다

이것도 중요한 포인트입니다.
👉 R² 높음 = 좋은 모델 ❌
이런 경우는 주의해야 합니다.
- 변수끼리 너무 비슷한 경우 (공선성)
- 과적합(overfitting)
- 설명은 잘 되지만 일반화 어려운 경우
👉 “높다 = 무조건 좋다” 아님
6️⃣ 많이 하는 실수
👉 R²만 보고 모델 판단 ❌
👉 낮으면 분석 바꾸기 ❌
👉 수치 올리려고 변수 추가 ❌
이건 모델을 맞추는 게 아니라 수치를 맞추는 것.
7️⃣ 논문에서는 이렇게 봅니다

논문에서는
👉 R² 하나로 판단하지 않습니다
함께 보는 것들:
- 회귀계수 유의성
- 방향성
- 이론적 타당성
👉 전체 흐름으로 판단
📌 이렇게 보면 됩니다
- R² 낮음 → 무조건 문제 ❌
- R² 높음 → 무조건 좋음 ❌
👉 상황에 따라 해석
👀 많이 틀리는 포인트
R² 집착 ❌
수치 올리기 ❌
모형 왜곡 ❌
👉 다 위험




