분류 | 게시판 |
베스트 |
|
유머 |
|
이야기 |
|
이슈 |
|
생활 |
|
취미 |
|
학술 |
|
방송연예 |
|
방송프로그램 |
|
디지털 |
|
스포츠 |
|
야구팀 |
|
게임1 |
|
게임2 |
|
기타 |
|
운영 |
|
임시게시판 |
|
(1) 정상적인 로지스틱 분석을 통한 결과(선형 모형을 가정한 로지스틱 회귀의 추정치와 실제치의 비교)
(2) 그루터기추억의 로지스틱분석 방법을 이용해 추정한 값과 실제 값의 비교(Actual vs Dummy Fitted)
(3) 실제 작업 과정
안녕하세요.
짧게 제 소개를 하자면 경제학/응용통계학을 전공하고 있는 학부 4학년을 마친 대학생입니다.
로지스틱 모형에 대한 이야기들이 많았는데요.
결론부터 말하면 틀린 겁니다.
(1)의 그래프와 (3)의 표의 Fitted가 실제 정상적인 과정을 통해 회귀한 로지스틱 회귀의 값입니다.
근데 (3)의 Fitted를 이용하면 실제 수치와 동일하게 결과를 낼 수 있는데요.
(3)의 Fitted를 p(t)로 적용하여 집어넣으면 실제 결과치와 같게 됩니다.
즉 회귀분석한 결과를 다시 데이터에 집어 넣으면 됩니다.
그 결과치는 Actual-Dummy Fitted의 결과에서 보셨듯이..완벽하게 일치합니다.
즉, 이 결과는 실수였던 혹은 고의였던 어찌됐든 간에, 추정한 결과를 이용해 다시 회귀한 모형이며
어떤 의미도 없습니다.
실수였다고하면 그 신중하지 못함을 문제삼아야 할 것이고
고의였다면 통계학으로 사기친거죠.
통계전공자로서 통계로 사기치는 행위는 절대 용납해서는 안되고 용서해서도 안된다고 늘 배웠습니다. 그런 사례가 아니길 바랍니다.
통계학 전공자로서 가장 마음에 와닿는 말 중 하나가
"거짓말, 새빨간 거짓말, 통계"라는 말입니다.
통계는 객관성으로 포장되어 있지만, 무지몽매한 사람에게 그것을 들이대면 거짓을 옹호하는 수단이 될 수 있습니다.
혹은 사람들을 혼란스럽게 하고 객관성이란 포장으로, 혹은 과학이라는 포장으로 사람들이 믿고 싶은 것을 믿게 하는 마력이 있지요.
다들 많이 힘드실 것으로 생각합니다만, 그리고 현실이 별로 믿기시지 않겠지만
마음을 고쳐잡고, 남은 시간들도 잘 버텨내고 희망을 잃지 않으셨으면 좋겠습니다.
예전처럼 쓸데 없이 진지한 선비들이 넘처나는 오유가 되었으면 좋겠습니다.
이상 지나가는 선비가 글을 올립니다.
죄송합니다. 댓글 작성은 회원만 가능합니다.