설문조사 끝나고 나면
많이들 이렇게 생각합니다.
“응답 수 충분하다”
“이제 분석하면 되겠지”
근데 실제 문제는 여기서 시작입니다.
모든 응답이 ‘쓸 수 있는 데이터’는 아닙니다

1️⃣ 불성실 응답이 왜 문제인가
겉으로 보면 다 정상입니다.
- 숫자 있음
- 응답 완료
- 표본 수 채움
근데 내용이 문제입니다
✔ 예
- 모든 문항 동일한 답
- 말이 안 되는 조합
- 무작위 선택
이건 데이터가 아니라 노이즈입니다
2️⃣ 불성실 응답 유형
❌ 1. 일관 응답 (straight lining)
- 전부 3번
- 전부 5번
👉 생각 없이 선택
❌ 2. 논리 오류
- 나이 20세 + 직업 교수
👉 말이 안 됨
❌ 3. 비정상 응답 패턴
- 앞뒤 문항 모순
❌ 4. 이상한 주관식
- “asdf”
- “ㅋㅋㅋㅋ”
의미 없음

3️⃣ 안 걸러내면 생기는 문제
❌ 1. 신뢰도 낮아짐
👉 Cronbach’s α 떨어짐
❌ 2. 결과 왜곡
👉 관계 이상하게 나옴
❌ 3. 논문 전체 신뢰도 하락
👉 교수님 바로 지적
결론: 분석 전에 반드시 제거
4️⃣ 가장 현실적인 필터링 기준
👉 이거 4개면 충분합니다
✔ 1. 응답 시간
→ 너무 빠른 응답 제거
✔ 2. 동일 응답 패턴
→ 반복 응답 제거
✔ 3. 논리 오류
→ 말 안 되는 데이터 제거
✔ 4. 주관식 확인
→ 의미 없는 답 제거

5️⃣ 사람들이 많이 틀리는 포인트
❌ 다 포함시킴
👉 데이터 오염
❌ 기준 없이 제거
👉 신뢰도 문제
❌ 너무 많이 제거
👉 표본 부족
균형이 중요
6️⃣ 실전에서 이렇게 하면 됩니다
👉 가장 많이 쓰는 방식
1️⃣ 1차 필터 (응답 시간)
2️⃣ 2차 필터 (패턴)
3️⃣ 3차 필터 (논리)
단계적으로 제거

7️⃣ 논문에서는 이렇게 쓰면 됩니다
✔ 예문
불성실 응답을 제거하기 위해 응답 시간, 응답 패턴, 논리적 일관성을 기준으로 데이터를 정제한 후 분석을 진행하였다.
👉 이 한 줄이면 충분
🔥 핵심 정리
불성실 응답은
❌ 데이터가 아니라
⭕ 제거 대상
좋은 결과는 좋은 데이터에서만 나옵니다


