모바일 오유 바로가기
http://m.todayhumor.co.kr
분류 게시판
베스트
  • 베스트오브베스트
  • 베스트
  • 오늘의베스트
  • 유머
  • 유머자료
  • 유머글
  • 이야기
  • 자유
  • 고민
  • 연애
  • 결혼생활
  • 좋은글
  • 자랑
  • 공포
  • 멘붕
  • 사이다
  • 군대
  • 밀리터리
  • 미스터리
  • 술한잔
  • 오늘있잖아요
  • 투표인증
  • 새해
  • 이슈
  • 시사
  • 시사아카이브
  • 사회면
  • 사건사고
  • 생활
  • 패션
  • 패션착샷
  • 아동패션착샷
  • 뷰티
  • 인테리어
  • DIY
  • 요리
  • 커피&차
  • 육아
  • 법률
  • 동물
  • 지식
  • 취업정보
  • 식물
  • 다이어트
  • 의료
  • 영어
  • 맛집
  • 추천사이트
  • 해외직구
  • 취미
  • 사진
  • 사진강좌
  • 카메라
  • 만화
  • 애니메이션
  • 포니
  • 자전거
  • 자동차
  • 여행
  • 바이크
  • 민물낚시
  • 바다낚시
  • 장난감
  • 그림판
  • 학술
  • 경제
  • 역사
  • 예술
  • 과학
  • 철학
  • 심리학
  • 방송연예
  • 연예
  • 음악
  • 음악찾기
  • 악기
  • 음향기기
  • 영화
  • 다큐멘터리
  • 국내드라마
  • 해외드라마
  • 예능
  • 팟케스트
  • 방송프로그램
  • 무한도전
  • 더지니어스
  • 개그콘서트
  • 런닝맨
  • 나가수
  • 디지털
  • 컴퓨터
  • 프로그래머
  • IT
  • 안티바이러스
  • 애플
  • 안드로이드
  • 스마트폰
  • 윈도우폰
  • 심비안
  • 스포츠
  • 스포츠
  • 축구
  • 야구
  • 농구
  • 바둑
  • 야구팀
  • 삼성
  • 두산
  • NC
  • 넥센
  • 한화
  • SK
  • 기아
  • 롯데
  • LG
  • KT
  • 메이저리그
  • 일본프로야구리그
  • 게임1
  • 플래시게임
  • 게임토론방
  • 엑스박스
  • 플레이스테이션
  • 닌텐도
  • 모바일게임
  • 게임2
  • 던전앤파이터
  • 마비노기
  • 마비노기영웅전
  • 하스스톤
  • 히어로즈오브더스톰
  • gta5
  • 디아블로
  • 디아블로2
  • 피파온라인2
  • 피파온라인3
  • 워크래프트
  • 월드오브워크래프트
  • 밀리언아서
  • 월드오브탱크
  • 블레이드앤소울
  • 검은사막
  • 스타크래프트
  • 스타크래프트2
  • 베틀필드3
  • 마인크래프트
  • 데이즈
  • 문명
  • 서든어택
  • 테라
  • 아이온
  • 심시티5
  • 프리스타일풋볼
  • 스페셜포스
  • 사이퍼즈
  • 도타2
  • 메이플스토리1
  • 메이플스토리2
  • 오버워치
  • 오버워치그룹모집
  • 포켓몬고
  • 파이널판타지14
  • 배틀그라운드
  • 기타
  • 종교
  • 단어장
  • 자료창고
  • 운영
  • 공지사항
  • 오유운영
  • 게시판신청
  • 보류
  • 임시게시판
  • 메르스
  • 세월호
  • 원전사고
  • 2016리오올림픽
  • 2018평창올림픽
  • 코로나19
  • 2020도쿄올림픽
  • 게시판찾기
  • 오유인페이지
    개인차단 상태
    도루라님의
    개인페이지입니다
    가입 : 17-02-28
    방문 : 497회
    닉네임변경 이력
    회원차단
    회원차단해제
     

    도루라님의 댓글입니다.
    번호 제목 댓글날짜 추천/비공감 삭제
    61 원 게시글이 삭제되었습니다. [새창] 2017-05-09 21:35:51 0 삭제
    제가 언제 더플랜 주장이 맞는지 틀린지 따지자고 했나요? 당신의 주장의 근거가 의미가 있는 건지를 따지고 있는거죠.
    더플랜이 개소리를 하고 있다고 치더라도, 당신 주장은 그거랑은 별개의 설득력을 가져야하는거죠. 왜 자꾸 더플랜이 어쩌고저쩌고 끌고 오세요. 괜히 치졸해 보이게.
    그래서 큰 구역의 수치를 작은 구역에 그냥 적용시켜 버린 기존 사례는 찾으셨나요? 제발 꼭 찾아주시길 바래요.

    그리고 여전히 코드는 공개 안하셨는데요. 코드를 공개 안 한 당신의 결과를 제가 왜 믿어야하는거죠?
    지금 당신 이름 걸고 주장하는 것도 아니잖아요? 익명의 뒤에 숨어서 그래프만 보여주면 땡인건가요?
    나름 사회적 파장이 있는 주장을 하시는 건데, 이름을 걸고 하시던가 그게 싫으면 당연히 코드와 데이터를 공개해야 믿을 수 있죠.
    지금 타인들을 설득하고 싶어하는 건 당신이구요, 제가 왜 직접 코드까지 짜면서 당신 주장이 맞다는 걸 그렇게까지 정성들여 확인해야하는지 모르겠네요. 코드 공개 싫으면 이름 걸고 하시던가요.

    데이터의 원 출처를 찾은 건 아주 잘하셨네요. 주장의 근거를 묻는 사람을 자꾸 겁먹고 배척하려고 하지 마시고 이렇게 자신의 주장을 차츰 더 강화시켜 나가시란 말이에요.
    그렇지만 데이터의 신뢰도를 따지자면 모든 개표상황표를 공개하고 있고 더 최근까지 많은 시간을 들여 정리한 더플랜의 데이터가 정확할 가능성이 더 높다고 보고요.
    그리고 당신이 하려는 일 자체가 더플랜의 주장이 틀렸다는 거 증명하는 거잖아요? 그렇다면 더플랜의 데이터로 그들의 주장을 부수는 것이 훨씬 설득력 있다고 생각하지 않나요? 이렇게 더플랜의 주장을 부수는 일에 열정을 가지고 있으면서 더플랜 데이터를 다루는 작업은 어떠케 아직 안하고 참으셨어요? 호랑이를 잡으려면 호랑이 굴로 진작에 들어가셨어야죠. 당신 말투로 봐서는 아주 실력이 뛰어나신 거 같은데 금방 전처리하실 수 있잖아요? 그리고 더플랜 데이터로 분석한 결과와 최성년 데이터로 분석한 결과가 크게 다르다면 더플랜 데이터 신뢰도 문제까지 제기할 수 있으니까 1석2조의 효과인데 이런 작업을 아직 안 하고 계셨다니 통계 능력에 비해 전략적 사고 능력은 좀 별로이신 거 같네요.

    자, 이왕 시작하신 거 저를 완전히 KO시켜 주시길 바래요. 현대 대한민국에 선거부정은 없었다고 믿고 싶습니다.
    60 원 게시글이 삭제되었습니다. [새창] 2017-05-08 20:30:07 0 삭제
    그리고 저는 되도록 전문용어 사용을 자제하려고 노력했습니다.
    저 보다 전문용어를 쓸데없이 남발한 것은 dacoon님이죠.
    59 원 게시글이 삭제되었습니다. [새창] 2017-05-08 20:23:51 1 삭제
    '요렇게 하면 다를 껄?'의 수준의 지적이 아니죠.

    신뢰성 부족한 데이터를 쓰는 걸 지적하는 게 무책임한 지적입니까? 객관적으로 생각해봤을 때, 원 데이터를 확인불가능한 최성년데이터와 개표상황표 사본까지 제공하는 더플랜데이터 어느 쪽이 더 신뢰가 갑니까?

    큰 구역 수치를 작은 구역에 아무 근거 없이 그냥 적용시켜버리는 문제가 상식적으로 납득이 됩니까? 그래서 이런 식으로 분석한 기존의 peer-reviewed paper 예시가 있으면 하나만 들어달라는 게 무리한 요청인가요? 그런 방식으로 분석한 기존의 논문을 찾을 수 없다면 이런 방식은 큰 문제가 있다고 보는 게 합리적이겠죠? 그렇다면 당연히 큰 구역 수치를 작은 구역에 무리하게 적용하면 안 되는 거죠.

    그리고 중요 결과 그래프에 대해 이 것을 산출하게 된 코드와 데이터를 요청하는 건 당연히 해야하는 거 아닌가요? 이런 중요 결과가 나오게 된 과정에 있어 로직의 문제가 없는지 같이 검증하고 확신하자는 게 이상한 겁니까?

    머신러닝이란 거 해본 적 없는 사람들 혹할만한 주장을 한 건 애초에 dacoon님이죠. 본문에서 트레이닝 데이터를 고스란히 테스트 데이터로 사용한 결과를 의미가 큰 것 마냥 주장했으니까요. 그런데 나중에보니 그에 대한 코드조차 첨부하지 않았습니다.
    58 원 게시글이 삭제되었습니다. [새창] 2017-05-08 19:14:53 0/4 삭제
    이제 보니까 본문에 있는 실제K값과 이론적K값에 대한 scatterplot 관련 코드는 공개하지도 않으셨네요.
    앞에 별로 중요하지도 않은 부분의 코드만 공개하고
    뒤에 핵심 내용에 대해서는 코드도 없고.
    도망가셔서 이 글 다시 보실지 안 보실지 모르겠지만 일을 한 번에 깔끔하게 끝내는 것도 실력의 범주에 들어간다는 거 명심하세요.
    57 원 게시글이 삭제되었습니다. [새창] 2017-05-08 18:24:42 1/4 삭제
    dacoon님 말투가 엄청 대단한 통계학 전문가인 것처럼 말하시니까
    실력이 저보다 훨씬 뛰어나실 것 같고 해서
    제가 1주일 걸릴꺼 1시간이면 하실 꺼 같아서요.

    그리고 노인비율과 K값 사이에 확실한 관계가 있다고 주장하시는 분은 dacoon님이신데,
    주장을 하는 사람에게 입증의 책임이 있는 거죠.
    저는 그 입증 과정에서 결함들이 있다는 걸 발견했고, 수정을 요청하는 거고요.
    그 결함들을 수정하고서도 결론이 그대로라면 저는 발벗고 나서서 dacoon님을 중앙선관위에 적극 추천하여
    더플랜이 사회적 혼란을 일으킨 책임을 지도록 노력할 생각입니다.
    56 원 게시글이 삭제되었습니다. [새창] 2017-05-08 17:40:21 1/4 삭제
    더플랜 데이터는 개표상황표 보고 거기서 옮겨 적어 정리한건데 가장 정확하죠.
    개표상황표 사본도 전부 pdf 파일로 제공하고 있어요.
    최성년 데이터는 최성년씨가 올린 원본을 어디서 확인가능하나요?
    그게 돌고도는 과정에서 왜곡된 데이터가 아니라는 걸 어떻게 보증하시죠?
    자꾸 더플랜 데이터 안 쓸 핑계 만들지 마세요.
    55 원 게시글이 삭제되었습니다. [새창] 2017-05-08 17:16:55 0 삭제
    제가 요구하는 사항을 하나씩 수행해 나가시는 모습 아름답네요.
    그런데 이왕 해주실려면 화끈하게 해달라는 저의 바램을 잊으신 거 같아요.
    요구사항 1개 충족해 주시고 마치 다 해준 거 처럼 하시면 안되죠.
    여전히 광역단위 수치를 투표구단위에 적용하신 거 같네요.
    데이터도 최성년 데이터 쓰신 거 같고요.
    이 그래프에 대한 코드랑 데이터는 공개를 아직 안 하셨고요.
    이왕 하실려면 저를 완전히 KO시킬 정도로 해주셔야지 쫀쫀하게 이게 뭡니까.
    나머지 사항도 마져 수행하셔서 코드랑 데이터 공개해주시길 바래요.

    그리고 큰 구역단위 수치를 작은 구역단위에 그냥 적용해버린 논문 사례가 있는지는 조사하셨나요?
    그 조사 결과도 같이 추가해서 글 써주세요.
    54 원 게시글이 삭제되었습니다. [새창] 2017-05-08 15:25:44 2 삭제
    저 옷 이름이 돌핀팬츠였군요....
    어쩐지 돌고래에게 느껴지는 이상한 호감은 이 것 때문이었나.
    53 원 게시글이 삭제되었습니다. [새창] 2017-05-08 12:11:01 3 삭제
    헐 곧 40이라니. 최근 본 김성령 사진이랑 동급 이펙트네요 ㄷㄷㄷㄷ

    52 원 게시글이 삭제되었습니다. [새창] 2017-05-08 11:38:18 1/9 삭제
    제가 해보기는 했다만 제가 해봤는가 안해봤는가 그 게 여기서 중요한 쟁점이 아니죠.

    분석 과정에 있어서 명백한 결함들이 있는데도 이를 수정보완할 생각은 안하고
    그 분석 결과를 그냥 믿고 있다는 게 문제라는 것을 알리고 싶은 겁니다.

    더플랜 팀의 분석에 결함이 있다면 그 걸 찾아내는 것도 의미있는 일이지만, 자신의 분석을 먼저 돌아보는 것이 순서겠죠.
    51 원 게시글이 삭제되었습니다. [새창] 2017-05-08 11:03:36 1/10 삭제
    결국에 도망가시는군요.

    제가 제시한 방식으로 분석할 용의가 없으시다면,
    최소한 '큰 구역 수치를 작은 구역에 그냥 적용한 사례'라도 찾아서 말씀해주세요.
    기다릴께요.
    50 원 게시글이 삭제되었습니다. [새창] 2017-05-08 10:37:05 1/8 삭제
    또 도망갈 밑밥을 까시네요.

    증평군만 봤을 때 1표씩만 다른 거고 다른 곳에서는 100표 차이난다면서요? 어쨋든 차이가 난다면 그냥 깔끔하게 가장 신뢰도 높은 데이터로 하는 것이 가장 설득력이 높은 결과를 만들어내는 거죠. 더플랜 데이터로 분석하는 게 별달리 더 힘든 것도 아니잖아요?

    그리고 주어진 작은 구역의 수치를 큰 구역의 수치로 aggregation해서 분석하는 사례는 많이 봤어도,
    큰 구역의 수치를 작은 구역에 그냥 적용시켜버리는 사례는 제가 듣도보도 못했네요. Peer-reviewed paper 중에 유사 사례가 있다면 제발 알려주세요. 큰 공부가 될 거 같네요.

    혹시 제가 요구하는 방법대로 하면 지금의 결론이 안 나올까봐 두려워 그러시는 건 아니겠죠?
    그런 게 아니라면 최대한 제 요구를 수용하셔서 제가 더 이상 나대지 못하게 화끈하게 증명해주세요.
    좀생이처럼 요구 1개 수용하고 "해줬잖아!" 이런 식으로 하시지 말고요.

    그럼 요구사항을 다시 제시합니다.
    1. 더플랜 데이터를 사용한다.
    2. 기계학습적 방식을 사용시 테스트 데이터와 훈련 데이터를 확실히 분리한다.
    3. 광역 단위의 데이터를 투표구 단위에 적용하지 않는다.

    별로 어렵지 않죠? 충분히 해 주실 수 있을꺼라 믿어요.
    49 원 게시글이 삭제되었습니다. [새창] 2017-05-08 09:15:29 2/5 삭제
    광역단위 이야기는 왜 무시하겠다고 하시는거죠?
    도대체 광역단위 수치를 투표구 단위에 적용하고도 문제가 없다는 근거는 어디서 나오나요?
    각 세부지역 마다 서로 지지율이 크게 다를 수도 있는건데 광역 단위 지지율을 투표구에 적용한 결과를 어떻게 신뢰할 수가 있죠?
    써먹을 수 없는 자료를 억지로 써먹으려고 하지 마시길 바래요.
    48 원 게시글이 삭제되었습니다. [새창] 2017-05-08 09:09:55 1/4 삭제

    제가 거듭 언급하지만 제가 언제 미분류율과 노년인구와의 상관관계에 대해 물었나요?
    핵심을 비껴나가는 행동은 자제해주세요.

    테스트/트레이닝으로 나누어 error 계산하는 가장 간단한 형태가 CV이라는 건 당신 혼자만의 생각이구요.

    예측된 K값과 실제 K값들에 대해 당신이 하신 식으로 scatterplot을 그려보면 되잖아요?

    프로젝트 부에서 써먹을 수 있는 데이터가 없다뇨?
    "http://www.projectboo.com/archive/143721"
    여기 개표상황표 정리표 데이터에 K값을 계산가능한 데이터가 다 나와있어요.
    47 원 게시글이 삭제되었습니다. [새창] 2017-05-08 08:41:31 1/7 삭제
    Cross validation 이야기는 당신이 먼저 꺼냈셨구요.
    꼭 기계학습적 방식을 사용하고 싶다면 다음과 같은 방법이 있죠.
    CV를 통해 모든 샘플에 대한 K 값를 예측을 하는거죠. 물론 예측대상이 되는 샘플은 훈련데이터에 포함되서는 안되구요.
    그리고 이 예측된 K값들과 실제 K값들을 비교하는거죠. 이게 이 글에서 당신이 수행한 분석방법 보다 훨씬 제대로 된 방법이죠.

    그리고 raw 데이터 어떻게 할 껀지랑, 광역단위 수치를 투표구 단위에 적용하는 문제 어떻게 할 껀지도 답해주세요.



    [◀이전10개] [31] [32] [33] [34] [35]

     
    단축키 운영진에게 바란다(삭제요청/제안) 운영게 게시판신청 자료창고 보류 개인정보취급방침 청소년보호정책 모바일홈