왜 싸움?이 나는지 이해가 안되서 제가 이해하고 있는게 맞나 질문하려고 글 써봅니다.
먼저 k값에 대해서 제 이해는 분류료의 두 후보간 득표 비율과 미분류표의 두 호보간 득표 비율이 얼마나 유사한지를 나타내는 지수로 이해되는데요,
더 플랜에 나온 계산대로면, 이론적으로 분류표와 미분류표에서 두 호보의 득표 비율은 같아야 하니 k=1 이겠죠? (고령인구 어쩌구 모두 제외하고, 모든 투표용지의 조건이 같으며 기계의 오류는 임의적으로 발생한다고 할때)
이때 k값이 1을 벗어나면 미분류표의 득표비율이 분류표에 득표 비율과 차이가 있다는 것이고 이론적으로 이 수치는 0~무한대가 되죠? 다른 말로 로그값을 취했을 때 평균이 0인 정규분포를 가진다는 이야기구요. 만약 k값을 한번 측정하면 그 값이 무조건 1이 나와야 한다는 것이 아니고, 수없이 반복하면 전체사건의 평균이 1에 근사하여야 한다는 이야기가 되죠. 근데 더 플랜의 문제제기는, 240여개 투표소의, 즉 240여개의 사건을 가지고 계산한 평균이 1.5이기 때문에 다른 외부요인이 사건에 개입했는다는 문제제기 아닌가요? 더더욱 이상한게 k가 1보다 작은 경우가 몇개 되지 않는것으로 보이므로 타당한 문제제기 같은데... 지금 어떤부분이 논쟁이 되고있는 것인지 도모지 모르겠어서 질문올립니다!