577
2017-06-07 09:11:31
1
모집단의 어떤 성질에 대한 정보를 얻기 위해 표본을 추출한다고 하면 표본은 알고자 하는 성질 외의 것에는 영향을 받지 않는 방법으로 선별되어야 합니다. 이러한 대표적인 방식이 무작위 추출이죠. 무작위 추출을 하게 되면 모집단이 가지고 있는 성질 외에는 어떠한 영향도 받지 않고 모집단과 비슷한 특성을 가지는 표본집단을 만들 수 있습니다. 그리고 이 표본집단은 모집단을 대표한다고 할 수 있죠.
예를 들어 어떤 남성과 여성으로 구성된 집단의 성비를 알고 싶다고 할 때 무작위로 추출하면 그 사람이 여성이거나 남성일 확률은 모집단의 성비의 영향을 받게 됩니다. 그리고 이걸 여러차례 반복해서 표본집단을 만들면 표본집단의 성비는 모집단과 비슷할 것이라고 기대할 수 있습니다.
하지만 무작위추출이 아니라 신장을 기준으로 170cm 이상인 사람만 선별하는 방식으로 했다면 어떨까요? 표본집단의 성비가 과연 모집단과 같다고 기대할 수 있을까요? 이렇게 선별한 표본집단이 모집단과 비슷할 것이라고 기대하기 위해서는 이 집단의 남성의 신장과 여성의 신장이라는 특성이 비슷하다는 전제가 필요합니다. 이러한 전제가 있다면 모집단과 표본집단의 성비가 비슷할 것이라고 기대할 수 있죠. 하지만 이런 전제가 없다면 모집단과 표본집단의 성비가 비슷할 것이라고 기대할 수 없습니다.
미분류표라는 것은 투표지의 상태를 보고 분류된 집단입니다. 무작위 추출이 아니기에 이렇게 선별된 표본이 모집단과 비슷한 특성을 가지고 있을 것이라고 기대할 수 없죠. 모집단과 표본집단이 비슷할 것이라고 가정하기 위해서는 미분류표의 선별 작업에 영향을 줄 수 있는 변수들이 동일하다는 전제가 필요합니다.
예를 들면 M과 P의 지지자가 실수할 확률이 완전히 같다는 전제나 투표지분류기가 P에게 간 표와 M에게 간 표의 실수에 대한 동일한 민감도를 가진다는 전제 같은 것들 말입니다.
이러한 전제가 있어야만 '아무런 조작이 없을 때 K는 1이라고 기대할 수 있다.' 라고 할 수 있습니다.