더플랜 - 그중에서도 k값 - 에 관하여 과게에서 이슈가 되고 있는데, 글을 보다보면 반복되는 논쟁이 있어서 그에 관해서 아여기해보려고 합니다.
" K 값의 평균은 1이 되어야 하는데 1.5였다. 이것은 부자연스러우므로, 기계 결함 혹은 조작의 근거가 된다."
여기서 쟁점이 되는것은 두 가지인데,
1. K값은 1이 되어야 한다.
2. K값이 1이 되지 않는 기계는 문제가 있다. (조작이든, 기계 결함이든.)
차례대로 살펴보도록 합시다.
1. K값은 1이 되어야 하는가
더플랜에서 제시한 근거는 다음과 같습니다.
a. 1로 보는 것이 자연스럽다. 96의 크기를 갖는 구멍과 4의 크기를 갖는 구멍이 있을때, ..어쩌구.
b. 남아있는 지지난 대선 결과를 확인하면 K값은 모두 1에 가깝게 나왔다.
그외에 '세계적인 석학들이 인정했다. 너가 그들보다 잘났다는 말이냐?' 라는 의견도 있습니다만.. 이것에 대한 반론은 어느 세계적인 석학의 어록으로 대신하도록 하겠습니다.
"과학에서는 세심하게 끌어내어진 논의와 논리를 믿어야지 권위를 믿어선 안됩니다."
먼저 a는, 단지 k=1일것 같다는 직관을 다른 방법으로 풀어쓴 것일 뿐입니다. 근거가 될 수 없습니다.
그다음 b.
b에서 제시하는 3 개의 자료는 16대 대선에서 한개의 지역구, 17대 대선에서 2개의 지역구에 대한 자료인데, 갯수가 너무 작습니다. 이것들이 16대와 17대 대선을 대표한다고 말하기 곤란합니다.
더플랜에 따르면 2012 대선에서도 K가 1보다 작은 지역구가 있었습니다. 남은 3개의 지역구가 그런종류의 지역구일 수도 있습니다.
역으로 생각할 수도 있습니다 .더플랜은 2012년 모든 선거구 데이터를 분석해서 k 평균이 1.5라는 유의미한 결과를 얻어냈습니다. 그렇다면, 이 3개의 데이터가 정상이 아니라는 생각도 할 수 있습니다.
한쪽에는 1.5 중심으로 정규분포를 그리는 251개의 선거구가 있고, 다른 한쪽에는 단 3개의 선거구가 1에 가까운 값을 가집니다. 어느 쪽이 더 자연스러운 것이라고 말할 수 있을까요?
게다가 이 3개의 자료에 대표성을 부여한다면, K값은 1보다 큰게 맞지 않겠느냐는 생각도 할 수 있습니다. 3개 모두 1.04, 1.02, 1.04로 1보다 크기 때문입니다.
지지난 대선과 2012 대선은 다르다는것도 문제입니다. 뭐가 다르냐고요? 그때는 17대고 지금은 18대인게 다릅니다. 농담인거 같다면 과게에 잘 오셨습니다.
각 대선마다 각 정당 후보가 다르고 그에 따른 투표층이 달라집니다. 사실 그것보다 큰건 기계가 바뀐다는겁니다. 더플랜에서 사용한 개표분류기는 2012년것보다 '한단계 업그레이드된' 모델이라고 합니다. 그러면 우리는 적어도 저번 대선과 이번 대선은 다른 개표분류기를 사용한다는 사실을 알 수 있죠. 17대와 18대가 완전히 같은 소프트를 가진 개표분류기를 사용한다는 사실이 있나요? 오히려 보안 강화와 성능 업그레이드를 강조하지 않았나요?
조금 업그레이드 된 기계가, k값도 조금 다르게 뽑아줄지, 그렇지 않을지 장담할 수 있나요?
2. K값이 1이 되지 않는 기계는 문제가 있다. (조작이든, 기계 결함이든.)
먼저 기계 자체의 특성에 의하여, k=1.5가 나온다고 합시다.
그러면 대체 무엇이 문제가 있는 겁니까. 미분류된 표를 기계가 먹나요..?
미분류된 표는 사람에 의해서 제자리로 찾아갑니다. 강제로 수개표가 되는거죠.
오히려, 미분류를 많이 만들수록 좋은게 아닌가 생각합니다. 사람이 직접 확인하는 표가 많아지니까요.
이번에는 이것이 기계의 특성이 아니고, 조작의 흔적이라고 합시다.
(사실은 이걸 말하고 싶어서 글을 썼습니다.)
그렇다면 필연적으로 다음의 질문이 떠오르게 마련입니다.
'미분류 표에 1번후보 비율이 상대적으로 높은 것이, 조작에 어떠한 이점이 되는가?'
더플랜에서는 이에 관하여 단 하나의 시나리오만을 제시하는데, (75분경입니다.)
그건 바로 미분류표를 내보낸 만큼을 무효표로 채워넣는다는 겁니다.
그리고 모종의 이유로..- 수개표 과정을 힘들게 하기 위함이라거나.. (그래서 기계분류 확인을 어렵게 만들기 위해),- 가짜로 채워넣은 그 만큼을 미분류표로 내보낸다는 것이죠.
그런데 이때, 가짜로 채워넣은 무효표 = 미분류표 비율이 될 이유가 조금이라도 있나요? 제가 만약 프로그램을 짠다면 이렇게 짤겁니다.
" 무효표를 가짜로 채워넣은 뒤에, 바로 다음에 나오는 유효표를 미분류표로 내보낸다."
가장 간단한 방법이죠. 그런데 이렇게 하면 K값은 1로 수렴할겁니다.
더플랜에서 말하는 K값은 그 뒤에서 말하는 조작가능성 문제와 전혀 다릅니다. 이것은 실제 개표조작이 일어났다는 증거로 사용하고 있기 때문이죠.
그런데 제가 생각하기에, 그것이 정말 조작인가 아닌가는 둘째 치고, 정말로 k값을 조작했다 치더라도, (정확히 말하면 어떤 설계의 결과가 k값을 바꿨다고 해야되겠지만..) 그것이 실제 개표를 유리하게 바꾼다는 근거가 될수가 없습니다.
많은 분들이 정말 K가 조작이냐 아니냐에 집중하시는데.. 저는 이부분이 더 문제가 있는게 아닌가 하는 생각입니다.