설문 데이터를 정리하다 보면
한 번쯤 이런 생각이 듭니다.
“이 응답… 제대로 한 거 맞나?”
- 너무 빨리 끝난 응답
- 같은 번호만 반복
- 앞뒤 문항이 전혀 안 맞는 경우
특히 온라인 설문에서는
이런 데이터가 생각보다 자주 등장합니다.
1️⃣ 가장 흔한 패턴: 한 번호만 계속 선택

가장 먼저 눈에 띄는 유형입니다.
예:
- 전 문항 3번
- 전 문항 5번
- 계속 같은 패턴 반복
이걸 보통
👉 직선응답(Straight-lining)이라고 부릅니다.
✔️ 왜 문제일까요?
응답을 읽고 판단했다기보다
👉 “빨리 끝내기” 가능성이 높기 때문입니다
특히 문항 수가 많을수록
이 패턴이 잘 나타납니다.
2️⃣ 응답 시간이 너무 짧은 경우
이것도 많이 봅니다.
예:
- 15분 설문을 2~3분 만에 완료
- 긴 문항인데 거의 바로 응답
👉 이 경우는
실제로 읽지 않았을 가능성 있음 ⚠️
✔️ 그렇다고 무조건 제거?
그건 아닙니다.
응답 속도는
- 모바일 환경
- 익숙한 주제
- 개인 차이
영향도 받기 때문입니다.
👉 중요한 건
“비정상적으로 짧은가”
3️⃣ 앞뒤 응답이 충돌하는 경우

이건 조금 더 숨겨진 유형입니다.
예:
- “매우 만족”
→ 뒤에서는 완전 반대 응답 - 같은 개념 문항인데
→ 방향이 계속 뒤집힘
👉 이런 경우는
문항을 제대로 읽지 않았을 가능성 있음
4️⃣ 그래서 보통 이렇게 확인합니다
데이터 정리 단계에서는
보통 이런 기준들을 같이 봅니다.
✔ 응답 시간
✔ 동일 번호 반복 여부
✔ 역문항 일관성
✔ 비정상 패턴 존재 여부
👉 하나만 보고 판단하지 않고
👉 여러 기준을 같이 확인
5️⃣ 중요한 건 ‘기준 없이 제거하지 않는 것’

많이 하는 실수입니다.
👉 “이상해 보이니까 삭제” ❌
이렇게 하면
- 연구 신뢰도 문제
- 자의적 제거 문제
생길 수 있습니다.
✔️ 그래서 보통은
- 기준 먼저 설정
- 제거 조건 명시
- 논문에 처리 방식 설명
👉 이 흐름으로 갑니다
6️⃣ 실제 논문에서는 이렇게 씁니다
✔️ 예문
불성실 응답 가능성이 있는 데이터를 제외하기 위하여 응답시간, 동일 응답 반복 여부 등을 기준으로 데이터 정제를 실시하였다.
👉 핵심은 “왜 제외했는지 설명 가능해야 함”
7️⃣ 완벽하게 구분하는 건 어렵습니다
이것도 중요한 포인트입니다.
👉 “100% 정확하게 찾기”는 사실 어렵습니다
그래서 중요한 건
👉 완벽한 제거가 아니라
👉 일관된 기준
🔥 핵심 정리

불성실 응답에서 중요한 건 하나입니다.
👉 “수상해 보이느냐”가 아니라
👉 “기준에 맞게 판단했느냐”
📌 이렇게 보면 됩니다
- 동일 응답 반복
- 비정상적으로 짧은 시간
- 응답 일관성 문제
👉 같이 확인



