오유인페이지
개인차단 상태
쿠로롱님의 개인페이지입니다
회원가입 : 05-01-20
방문횟수 : 822회
닉네임 변경이력
일반
베스트
베오베
댓글
829 2017-06-03 20:02:56 1
19대 k값과 합리적 의심 [새창]
2017/06/03 15:54:32
과게 베스트 K제목이 들어간 글들 훑어보고 왔습니다. 역시 제 리플을 기존 과게 프레임에서 잘못 이해하시고 있다고 밖에 생각이 안드네요.

전엔 과게도 들려서 종종 봤는데, 요샌 안봐요. 글과 리플들이 너무 공격적이라. 저도 남아서 토론하다 보면 그렇게 될 거라는걸 알기 때문에, 제가 리플 남긴 글도 왠만하면 잘 보지 않습니다. 혹시나 나중에 리플 남기시게 되면 죄송하다는 말씀 드릴게요.

그럼 초등학교에서 정수통 실험 안해본 저는 이만 물러가겠습니다.
828 2017-06-03 19:41:14 1
19대 k값과 합리적 의심 [새창]
2017/06/03 15:54:32
제 말을 잘못 이해하신 것 같습니다. 아마 제가 봤던 글일 것 같기도 하구요. 제 리플 내용은 노인가설(+기타등등) 맞다고 할 때 문제가 된다는 겁니다.
827 2017-06-03 19:36:30 1
19대 k값과 합리적 의심 [새창]
2017/06/03 15:54:32
제가 가끔 베스트나 보는 정도라 링크 주시면 잘 볼게요.
826 2017-06-03 19:32:30 1
19대 k값과 합리적 의심 [새창]
2017/06/03 15:54:32
네, 더 플랜에서 제시한 방법도 사람이 나중에 검사하는겁니다. 왜냐하면 분류기와 사람의 결과가 일치하지 않으면 사람이 다시 한번 검사하니까요.
825 2017-06-03 19:29:29 5
19대 k값과 합리적 의심 [새창]
2017/06/03 15:54:32
혹시 더 플랜 보셨나요. 더 플랜에서는 부정선거->k=1.5 가 가능하다고 했지, k=1.5->부정선거라고 나온적은 없습니다. 하지만 k가 1인 상황이 이상적인 상황인 것은 맞습니다.
개표 과정에서 분류기의 분류는 사람에 의해 수정됩니다. 그리고 사람 역시 확률로 오류를 내게 됩니다. 만약 k가 1이라면 전체 득표수에는 오류가 있더라도, 득표 비율에는 문제가 없습니다. 하지만 k가 1에서 크게 벗어나면 득표 비율에도 영향을 주게 됩니다.

더 플랜에서는 불완전한 분류기를 가지고 있더라도 사람이 높은 확률로 수정할 수 있으면 영향을 최소화 수 있기 때문에, 사람이 먼저 분류하고 분류기가 확인하는 방법을 제시했습니다.
결국 선관위가 적용한 방식도 같은 접근 방식인데, 분류기의 분류 속도를 낮춰서 사람이 오류를 저지를 확률을 낮추는 방법이었습니다.

제 생각에는 분류기에 bias가 있으면 bias가 있는 결과를 보정을 시키거나, bias를 없애는게 맞다고 생각합니다. 그게 힘들어 보이지도 않구요. 하지만 투표에서 bias를 보정한 값을 쓴다는건 어불성설이고, 결국 bias를 없애는게 맞지 않나 생각합니다.
824 2017-06-03 06:32:51 25
이것이 투표지분류기 입니다. [새창]
2017/06/02 21:42:58
그럴리가요? 더 플랜에 저 영상이 그대로 나오는데...?
823 2017-05-22 21:30:46 1
(새로운 사실) 부재자투표로 18대 대선 조작설을 검증해 보았습니다. [새창]
2017/05/21 16:48:38
두 가지 눈에 들어오는 점이
1. F값의 평균을 계산하지 않고 전체 득표로부터 다시 계산하시는 부분은 실수하신 것 같구요 (그래서 결국 나중에 다시 보정을 하고, 샘플링이 잘못됐다는 이상한 곁다리가 들어가게 됐죠...)
2. 1.1이 높다 혹은 1.00076이 낮다는 판단의 근거가 없는 것 같아요.
그래도 부재자 투표를 들여다 보는 것은 좋은 아이디어인 것 같네요. 정성에 추천 드립니다.
822 2017-05-15 04:34:52 0
미분류는 얼마나 많으면 많은 것인가? [새창]
2017/05/14 00:06:36
curio// 사실 같은 분류 알고리즘으로 돌렸을때 같은 양상이 나오는지 그리고 왜 그런 bias가 나오는지에 대한 분석. 앞으로의 해결방안을 제시하면 되는 간단한 문제죠. 무슨 보안이 필요한 프로그램도 아니고...

Limeade// 투표용지 분류와 같은 문제의 경우, 인간이 할 수 있는 것보다 기계가 n배 더 잘 할 수 있을 것 같네요. 정말 보수적으로 말씀드려도 최소 인간이 할 수 있는 정도 수준은, 훨씬 높은 정확도로 할 수 있습니다. 뭐 뭉개진 표 이런건 일도 아니구요... 인간이 유효표인지 무표효인지 확신을 할 수 있는 투표 용지라면, 같은 기준으로 기계는 훨씬 더 정확한 판단을 할 수 있습니다. 애매하게 뭉개진 무효표 100개가 있다고 할 경우, 인간이 100장에 대해 모두 같은 기준으로 판단할 수 있을까요? 아니면 A라는 사람과 B라는 사람이 같은 기준으로 판단할 수 있을까요? 기계는 정량적인 수치를 기반으로 말 그대로 '기계적'으로 판단할 수 있습니다.

코그니토// 맞습니다. 일반론이죠. 하지만 가끔 인터넷에서 보면 일반론을 적용하는 위치가 틀린 사람들이 있습니다. 투표 패턴인식 관련해서 머신러닝 쪽 이야기를 꺼내는 사람은 진화론 얘기하는데 성경구절 예를 들면서 설명하는 사람 보는 느낌? 맞는 말이지만 뭔가 이 사람은 초점이 엇나가있달까...

만약 투표 용지 이미지 분석 알고리즘 숙제, 이런 패턴이 찍혀야 한다고 문제 설정을 해서 내줬는데, 학부생이 머신러닝을 들고오면 내용과 태도를 봐서 점수를 줄 수도 있을 것 같습니다. 대학원생이 들고 오면 혼 좀 나야 되구요. 동료가 들고왔으면, 안 친한 사람이라면 그냥 같이 일하는 걸 피하겠습니다. 친한사람이라면 이야기 좀 해보구요. 물론 투표 용지 분석에도 머신러닝 쓸 수 있고 향상 시킬 수 있는 부분 있습니다, 하지만 제가 본 글들은 대부분 문제 설정조차 제대로 안 된 수준낮은 이야기들이었습니다.

작성자님의 본문과는 크게 연관 있다고는 할 수 없는데, "패턴 인식과 기계 학습"이라는 텍스트와 "한 분야의 교수나 박사들이 다른 분야의 교과서 1장 수준의 이야기도 모르는 것이 그렇게 이상한 일은 아닌 것"이라는 말에 호응해서 이런쪽으로 생각이 뻗어나가버린 것 같네요. 제 리플 보시면 아시겠지만, 본문의 일반적인 내용을 부정하는게 아니니 오해 없으시길 바랍니다.
821 2017-05-14 08:22:43 1
미분류는 얼마나 많으면 많은 것인가? [새창]
2017/05/14 00:06:36
패턴 인식 관련해서 머신 러닝쪽 이야기를 하시는 분들이 가끔 있는데, 잘못된 접근입니다. 머신 러닝에서 다루는 패턴 인식은 a priori model을 특정하기 힘든 경우 쓰는 방법입니다.
투표 용지의 경우 어떤 패턴이 어떤 크기, 심지어 어떤 색깔로 찍히는지까지 알고 있기 때문에 정확도는 거의 100%에 가까울겁니다. 물론 이미지 퀄리티에 따라 다르기는 하겠지만, 제 경우 이미 알고 있는 패턴을 1초에 100,000장을 찍는 초고속 카메라로 분석한 경우가 있는데 사람 눈으로 매우 흐릿하게 보일 정도의 이미지 퀄리티라도 정확한 패턴을 이미 알고 있는 경우 몇 픽셀 이내의 오차로 분석이 가능합니다 (심지어 이 경우에도 1픽셀 이내의 오차가 대부분입니다) . 물론 투표 용지 분석은 훨씬 느리고 좋은 이미지 퀄리티로 할 거라고 생각되구요.

제 경험에 따르면 투표 도장이 찍힌 위치는 100% 가까운 확률로 쉽게 분석 가능할거라고 봅니다. 결국 무효표를 결정하는건 사람의 기준이죠. 경계선과 얼마나 가깝나, 인주가 얼마나 blur되었나 등등. 그런데 기계에서 무효표로 분리된 것이 유효표로 분류된 것이 거의 90% 였다고 한걸로 기억하는데, 제 경험상으로는 신뢰도 설정을 생각해도 약간 납득하기 어려운 수치이지만, 3%라는 오차가 큰지 작은지를 포함해서 결국 제조회사쪽이 판단 알고리즘을 어떤식으로 정했는지에 대해 물어볼 수 밖에 없습니다.
820 2017-04-22 22:10:24 1
K=1.5가 우연히 나올 수 있는 수치라구요? [새창]
2017/04/21 22:40:32
궁금해서 검색해봤는데 아직 논문이 출판 안 된 상태, 찾은 건 preprint 버젼입니다.
"와 베이지안 통계학을 들먹이시네.. 그게 뭔지는 아십니까??"
이런 말이야 말로 지금 과게 수준을 보여주는거죠. 쓴웃음이 나오네요.
819 2017-04-22 15:32:59 2
K=1.5가 우연히 나올 수 있는 수치라구요? [새창]
2017/04/21 22:40:32
제 이야기를 지엽적으로 이해하신 것 같네요. 제가 말한 의미는 과게의 논리는 causality, 조금 더 넓게 생각하면 plausibility에 대한 고려가 없기 때문에 아무런 의미가 없다는 겁니다. 과학 논문 이야기도 그런 맥락에서 한 이야기구요.

곁가지로 인정에 대해서 얘기하자면, 최소한 해당 논문은 peer review를 거친 논문입니다. 과게의 글들을 보면 해당 논문의 자료를 가지고 충분히 이야기 할 수 있는 것들임에도 불구하고 말로만 그치는 것 같습니다. 아래 분이 이야기 하신대로, 논문으로 따로 내거나 최소한 preprint 서버에라도 올려서 공유하는게 더 생산적일 것 같네요.
817 2017-04-22 14:34:25 4/9
K=1.5가 우연히 나올 수 있는 수치라구요? [새창]
2017/04/21 22:40:32
Bayesian analysis를 하면 도난일 확률이 100%에 가깝습니다. 하지만 지금 과게의 주류 의견대로라면 도난이라고 하면 멍청한 소리가 되겠죠.
그 의견을 받아들이면, 현존하는 모든 과학 논문은 근거없는 논문들입니다.
오유 유저분들께는, 우선 상식을 따르시면 된다고 말씀드리고 싶네요.
816 2017-04-11 12:22:12 2
후지이 미나도 '문제적 남자'에 나왔으면 좋겠네요 [새창]
2017/04/07 16:37:00
어떤 분야에서 A라는 대학이 B라는 대학보다 우월하다고 하는 것은 객관적인 사실일 수 있습니다. 하지만 A라는 대학을 나왔다고 무조건 B라는 대학을 나온 사람보다 뛰어나다고 생각하는 것은 차별입니다. 제 생각은 그래요.
815 2017-04-11 12:19:53 4
후지이 미나도 '문제적 남자'에 나왔으면 좋겠네요 [새창]
2017/04/07 16:37:00
그러게요. 제 주변 사람들은 이런 줄세우기를 싫어하는 깨어있는 사람들이라, 성적상관없이 랜덤으로 대학 찍어서 갔어요!

농담은 집어치우고, 남자가 여자보다 평균적으로 근력이 강하다라고 하는 것은 차별이 아니라 사실입니다. A라는 남자, A보다 근력이 강한 B라는 여자가 있을 때, B는 여자니까 근력이 약해 라고 하는 것이 차별입니다.
< 이전페이지 다음페이지 >
1 2 3 4 5 >
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호