뉴스레터 가입하기

이 양식을 작성하려면 브라우저에서 JavaScript를 활성화하십시오.
가입경로
여기에 입력해주세요.
Edit Template

결측값이 생각보다 많을 때, 무조건 삭제해야 할까요?

설문 데이터를 열어봤는데,
여기저기 비어 있는 값들이 눈에 들어옵니다.

처음에는 몇 개 안 되는 것처럼 보이다가
막상 확인해보면 생각보다 많습니다.

이때 가장 먼저 드는 생각은 보통 이겁니다.

“이거 다 지워야 하나요?”
“결측값 많으면 분석 못 하는 거 아닌가요?”


결측값을 보면 가장 먼저 불안해지는 이유

결측값이 많아 보이면
연구가 제대로 안 된 것처럼 느껴지기 쉽습니다.

  • 설문 설계를 잘못한 건 아닐지
  • 응답자들이 대충 응답한 건 아닐지
  • 이 데이터로 논문을 써도 되는 건지

불안이 한꺼번에 몰려옵니다.

하지만 결측값이 존재한다는 사실 자체가
곧바로 ‘잘못된 데이터’를 의미하지는 않습니다.


1️⃣ 결측값은 왜 생길까요?

결측값은 다양한 이유로 발생합니다.

  • 응답자가 특정 문항을 건너뛴 경우
  • 민감하거나 답하기 어려운 문항이 있었던 경우
  • 설문 흐름상 조건부 문항이었던 경우
  • 단순한 실수나 응답 중 이탈

즉, 결측값은 응답자의 태도나 상황을 반영한 결과일 수도 있습니다.

그래서 결측값을 볼 때
“왜 생겼는지”를 먼저 확인하는 것이 중요합니다.


2️⃣ 무조건 삭제하면 생길 수 있는 문제

결측값이 보이면
가장 쉽게 떠올리는 방법은 ‘삭제’입니다.

하지만 무작정 삭제할 경우,
다음과 같은 문제가 생길 수 있습니다.

  • 표본 수가 크게 줄어듦
  • 특정 집단의 응답만 사라질 가능성
  • 분석 결과의 대표성이 약해짐

특히 결측값이 특정 문항이나 특정 집단에 집중되어 있다면,
삭제는 오히려 결과를 왜곡할 수 있습니다.


3️⃣ 그렇다면 언제 삭제해도 괜찮을까요?

결측값을 삭제해도 비교적 문제가 적은 경우도 있습니다.

예를 들면,

  • 결측값 비율이 매우 낮은 경우
  • 완전 무작위로 빠져 있는 경우
  • 분석에 핵심적이지 않은 문항인 경우

이런 상황이라면
삭제가 합리적인 선택이 될 수 있습니다.

중요한 건, ‘삭제했다’는 사실보다 ‘왜 삭제했는지’를 설명할 수 있는지입니다.


4️⃣ 삭제 말고 다른 선택지는 없을까요?

결측값을 다루는 방법은 삭제만 있는 것이 아닙니다.

연구 상황에 따라,

  • 평균 대체
  • 문항 평균 대체
  • 분석 방법에 따른 처리

등의 선택지도 고려될 수 있습니다.

다만 여기서 중요한 점은,
결측값을 어떻게 처리했는지가
연구 결과 해석에 어떤 영향을 미치는지

연구자가 인지하고 있어야 한다는 것입니다.

방법보다 중요한 건 그 선택이 연구 흐름 안에서 설명 가능한지입니다.


5️⃣ 지도교수님이나 심사에서 실제로 보는 포인트

결측값 때문에 지적을 받는 경우는
대부분 이런 상황입니다.

  • 결측값이 있는데, 아무 설명도 없는 경우
  • 처리 방법을 선택한 이유를 말하지 못하는 경우
  • 결측값이 결과에 미친 영향을 전혀 언급하지 않은 경우

반대로, 처리 기준과 판단 이유가 정리되어 있다면
결측값 자체가 큰 문제가 되는 경우는 많지 않습니다.


🔥 정리

  • 결측값이 많다고 해서 무조건 삭제해야 하는 것은 아닙니다.
  • 먼저 결측값이 왜 발생했는지 확인해야 합니다.
  • 삭제는 하나의 선택지일 뿐, 유일한 답은 아닙니다.
  • 중요한 것은 처리 방식이 연구 흐름 안에서 설명 가능한지입니다.

설문 이후 통계 단계에서 막히는 이유는
기술적인 문제보다,
판단 기준이 정리되지 않았을 때 더 자주 발생합니다.


이 구간에서 많은 대학원생들이 비슷한 감정을 느낍니다.

  • 데이터는 모였는데, 손대기가 무서운 느낌
  • 하나를 고치면 전체가 흔들릴 것 같은 불안
  • 이 선택이 맞는지 계속 확신이 안 서는 상태

그리고 이런 말이 자연스럽게 나옵니다.

“이 데이터, 괜히 건드렸다가 더 망가지는 건 아닐까요?”


혹시 지금 이 단계에 계신가요?

그렇다면,
통계를 못해서 막힌 상황이라기보다는
어떤 기준으로 판단해야 할지 정리되지 않은 단계일지도 모릅니다.

결측값은 연구 과정에서 아주 흔하게 등장하는 요소입니다.
중요한 것은 없애는 것이 아니라,
어떻게 다루고 설명하느냐입니다.

비슷한 고민을 먼저 겪은 연구자들의 경험을 참고하는 것만으로도
다음 판단이 훨씬 수월해지는 경우가 많습니다.

K-Grad​

한국 대학원생 협회에서는 대학원생들을 위한 수많은 정보와 혜택, 그리고 강의를 제공합니다.

Features

Most Recent Posts

무료회원가입

무료회원가입 후 혜택받으세요!

Category

대학원생을 위한 유일한 협회!

Help

Copyright

Privacy Policy

Mailing List

© 2023 Created with K-GRAD