뉴스레터 가입하기

이 양식을 작성하려면 브라우저에서 JavaScript를 활성화하십시오.
가입경로
여기에 입력해주세요.
Edit Template

선형회귀, 쓰면 안 되는 데이터도 있습니다

회귀분석을 처음 접하면
가장 먼저 배우는 방법이 선형회귀입니다.

그래서 자연스럽게
어떤 데이터든 일단 선형회귀부터 돌려보게 됩니다.

그런데 결과가 이상하게 나올 때가 있습니다.

  • 계수가 해석이 안 되거나
  • 유의성이 계속 흔들리거나
  • 직관과 전혀 맞지 않는 결과가 나오는 경우

이때 한 번쯤 생각해볼 필요가 있습니다.

“이 데이터에 선형회귀가 맞는 걸까?”


1️⃣ 선형회귀는 ‘조건이 맞을 때’ 의미가 있습니다

선형회귀는 이름 그대로
변수 간 관계가 ‘선형’일 때 잘 작동하는 분석입니다.

즉,

  • X가 증가하면 Y도 일정한 방향으로 변하고
  • 그 관계가 직선 형태로 설명될 수 있을 때 의미가 있습니다.

이 전제가 깨지면
분석 결과 자체가 흔들릴 수 있습니다.


2️⃣ 이런 데이터에서는 주의가 필요합니다

다음과 같은 경우라면
선형회귀를 그대로 사용하는 것이 적절하지 않을 수 있습니다.

  • 변수 간 관계가 곡선 형태인 경우
  • 종속변수가 범주형(예: 예/아니오)인 경우
  • 데이터 분포가 한쪽으로 심하게 치우친 경우
  • 이상치가 큰 영향을 주는 경우

이런 상황에서는
선형회귀가 관계를 제대로 설명하지 못할 수 있습니다.


3️⃣ 결과가 이상하게 나오는 이유

이런 데이터를 선형회귀에 그대로 넣으면
다음과 같은 문제가 나타납니다.

  • 설명력이 낮게 나오거나
  • 계수 방향이 뒤집히거나
  • 유의성이 불안정하게 변하는 경우

이때 많은 경우
데이터를 의심하게 되지만,

실제로는
👉 모형이 맞지 않는 경우도 많습니다.


4️⃣ 그렇다고 무조건 틀린 건 아닙니다

여기서 중요한 점은
선형회귀를 썼다고 해서
무조건 틀린 분석이 되는 것은 아니라는 것입니다.

다만,

  • 이 데이터가 선형 관계인지
  • 다른 방법이 더 적절한지를 한 번 점검해보는 과정이 필요합니다.

5️⃣ 많이 하는 실수

이 부분에서 자주 나오는 실수는 다음과 같습니다.

  • 아무 데이터에나 선형회귀를 적용하는 경우
  • 결과가 이상해도 그대로 해석하는 경우
  • 분석 방법을 바꾸지 않고 반복하는 경우

이렇게 되면
문제는 데이터가 아니라
분석 선택이 됩니다.


6️⃣ 결국 중요한 것은 ‘적합한 분석 선택’

통계에서 중요한 것은
얼마나 많이 아느냐가 아니라,

👉 “이 데이터에 어떤 방법이 맞는지 판단하는 것”입니다.

선형회귀는 강력한 도구지만,
모든 상황에 맞는 도구는 아닙니다.


📌 이렇게 보면 됩니다

  • 선형회귀 = 직선 관계 전제
  • 비선형 / 범주형 / 치우친 데이터 → 주의 필요

👉 분석은 “맞게 쓰는 것”이 핵심

K-Grad​

한국 대학원생 협회에서는 대학원생들을 위한 수많은 정보와 혜택, 그리고 강의를 제공합니다.

Features

Most Recent Posts

무료회원가입

무료회원가입 후 혜택받으세요!

Category

대학원생을 위한 유일한 협회!

Help

Copyright

Privacy Policy

Mailing List

© 2023 Created with K-GRAD