<div>미분류표 이야기하면서 심심찮게 튀어나오는 이야기가 </div> <div>" 미분류로 튀어나온 투표용지 중 정상분류표가 보이더라.. 기계 오류가 심각하다. "</div> <div>라는 주장이라서 글을 올려봅니다.</div> <div><br></div> <div>사실 제대로 분류시스템 오류를 어떻게 나누어 다루느냐를 이야기하려면 <span style="font-size:9pt;">아래 사진같은 딱딱하고 얘길 해야해요.</span></div> <div> <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201705/1494602672a652b5902a234162b3dd889c7a7055d9__mn523349__w1280__h720__f133112__Ym201705.jpg" alt="ROC curve.jpg" class="chimg_photo" style="border:none;width:640px;height:360px;" filesize="133112"></div> </div> <div> </div> <div>하지만 저도 그렇고 다들 골치아픈 거 싫잖아요?</div> <div>그래서 (윗 사진과 같은 똑같은 개념은 아니지만)</div> <div>간단하게 직관적으로 보일 수 있도록 이야기를 해보려 합니다.</div> <div> </div> <div> </div> <div> </div> <div> </div> <div>썩은 사과들을 모아 사과 잼을 만드는 회사가 있다고 해 봅시다.</div> <div> </div> <div> </div> <div> <div style="text-align:left;"><img src="http://thimg.todayhumor.co.kr/upfile/201705/1494602734e3d66dc879534513a7bc9284ed6fe2f5__mn523349__w512__h342__f21421__Ym201705.jpg" width="512" height="342" alt="썩은사과.jpg" style="border:none;" filesize="21421"></div><br></div> <div>썩은 사과들을 그대로 집어넣어 잼을 만들면 품질이 나빠질테니</div> <div>사과에서 썩은 부분들만 도려내는 기계가 필요하겠죠?</div> <div><br></div> <div>그런데 썩은 부분들만 아주 정확하게 잘라낸다는 게 가능할까요?</div> <div>대충 썩은 부분만 팍팍팍팍~~~ 쑹덩쑹덩~~ 잘라내주면 될 꺼에요.</div> <div>(물론 요즘은 아주 고오급 욋과수술용 로봇들도 나온다지만 그걸로 사과다듬기엔...)</div> <div><br></div> <div>그런데 딜레마가 있어요.</div> <div><br></div> <div>썩은 부분 도려내는 기계를 만드는 사람도 고민해야 하고</div> <div>잼을 만드는 회사도 고민하는 공통의 딜레마가 생깁니다.</div> <div><br></div> <div><font color="#ff0000">" 잼의 품질을 높이려면 썩은 부분을 확실하게 제거해야 한다. "</font></div> <div><font color="#ff0000"><br></font></div> <div><font color="#ff0000">" 그런데 <b>확실하게 제거하려면, 그만큼 큼직큼직하게 잘라내야</b> 한다. "</font></div> <div><font color="#ff0000"><br></font></div> <div><font color="#ff0000">" 하지만 <b>너무 크게 잘라내면</b> 썩은 부분뿐만 아니라 <b>멀쩡한 부분들도 함께 잘려나간다.</b> "</font></div> <div><br></div> <div>결국 고품질 잼을 생산하고 싶어하는 잼 회사에서는</div> <div>그만큼 썩은 부분을 크게 잘라내려 할 것이고</div> <div>좀 저품질이더라도 사과가 아까운 회사는 작게 잘라내려 할 겁니다.</div> <div><br></div> <div>미분류표에서 (사람이 보기에)정상분류표들이 섞여나오는 건 </div> <div>사과의 썩은 부분과 함께 잘려나오는 멀쩡한 과육들이 있는 거랑 마찬가집니다.</div> <div><br></div> <div>미분류의 기준을 높이거나 낮추는 것은 </div> <div>마치 사과의 썩은 부분을 얼마나 크게 혹은 작게 잘라내느냐는 정도를 조절하는 겁니다.</div> <div><br></div> <div>선관위에서는 고품질 잼(?)을 얻고 싶어하니 </div> <div>아주 크게크게 썩뚝썩뚝 썰어내는 거고, </div> <div>그러다보니 (사람이 보기에)정상분류표들이 섞여나오는 횟수도 많아질 수 밖에 없어요.</div> <div><br></div> <div>다만 사과잼 회사와 선관위의 차이점은,</div> <div><span style="font-size:9pt;">사과잼 회사는 잘려나온 부분들을 그냥 버리지만</span></div> <div><br></div> <div>선관위에서는 참가자들을 통해 </div> <div>진짜 썩은 부분(무효표)와 멀쩡한 부분(정상 분류가능 표)을 </div> <div><b>수작업으로 다시 한번 분류한다</b>는 차이가 있는 거죠.</div>