K 값 이야기하면서 지금까지 계속 사람들이 반복되게 혼동되는 부분이 있어서
그림으로 비유해서 설명해보고자 합니다.
먼저,
- 그림에서 박근혜 투표는 붉은 색, 문재인 투표는 파란 색입니다.
- 각각의 진한 붉은 색, 진한 파랑색은 미분류표 입니다.
- 미분류표는 무효표가 아니라, 기표 모호성 때문에 기계가 뱉어낸 표 입니다.
. 즉 한가운데 정확히 기표된건 미분류표로 빠지지 않으며
. 무효표까지는 아니지만 도장찍은 상태가 안좋은 표들을 얘기합니다.
. (아웃처리까지는 아니다만, 투표용지에 왜 이따위로 찍었냐 싶은 기표 불량들.)
(1) K 값이 1이어야 하는 경우.
. 박근혜 표 전체 10개 중 모호표(미분류 유발) 2개. 20% 입니다.
. 문재인 표 전체 5개 중 모호표(미분류 유발) 1개. 20% 입니다.
전체에서
. 박근혜 : 문재인 비율은 20:10 = 2:1 입니다.
미분류표들에서
. 박근혜 : 문재인 비율은 2: 1 = 2:1 입니다.
고로, 양쪽다 비율 똑같습니다.
2/20 : 1/10 = 0.1 : 0.1 <-- 양측이 동일, K값은 1이어야 합니다.
(2) K 값이 1이 아니어야 하는 경우.
. 박근혜 표 전체 10개 중 모호표(미분류 유발) 3개. 30% 입니다.
. 문재인 표 전체 5개 중 모호표(미분류 유발) 1개. 20% 입니다.
전체에서
. 박근혜 : 문재인 비율은 20:10 = 2:1 입니다.
미분류표들에서
. 박근혜 : 문재인 비율은 3: 1 = 3:1 입니다.
따리서 비율이 달라집니다.
3/20 : 1/10 = 0.15 : 0.10 <-- 양측이 다릅니다. K 값은 1 이 될 수 없습니다.
정리해서 이야기하자면,
K 값 1이 유지되어야 한다는 얘기는
단순히 전체 집합(전체 투표)에서 완벽하게 랜덤 추출했을 때,
두개 서브 집합(박근혜,문재인)의 비율이 같아야 한다는 얘깁니다.
하지만 랜덤 추출이 아닌
기표 모호성이 있는 표들만 뽑았고,(즉 미분류표)
그리고 두 개 서브 집합내 기표 모호성 표들의 비율이 다른 상태라면
기표 모호성 표 내에서의 두개 서브 집합(박근혜,문재인)의 비율은 같을 수가 없게 되는 겁니다.
PS. 다시 말씀드리면, 이 글은 K 값이란게 뭐냐라는 설명을 위한 글입니다.