http://www.yes24.com/Product/Goods/103170454
데이터 해석학 입문 - YES24
이 책에서는 각종 분석기법뿐만 아니라 데이터의 편차나 편향에 관한 기초지식, 데이터에 다양한 편중을 발생시키는 행동심리학, 샘플링의 방법과 이론, 데이터 핸들링의 노하우, 각종 분석의
www.yes24.com
수집한 데이터에 포함된 여러가지 편향들을 종합해서 선택편향이라고 합니다. 전체 데이터에서 일부 데이터만 선택 함으로써 발생하는 편향 이라는 의미입니다.
2차 세계대전에서 통계학자 아브라함 왈드는 귀환한 폭격기들의 손상흔적의 분포를 분석하고 미군의 분석인 공격을 많이 받은 부분을 보강해야 한다는 결론에 반박하면서 손상이 작은 곳을 보강해야 한다고 주장했습니다. 공격을 받고 추락한 기체는 데이터에 포함되어 있지 않다는 것입니다. 이렇게 살아남은 쪽 밖에 관측되지 않는 편향을 선택편향 중에서 생존자 편향이라고 합니다. 관측할 수 있는 데이터가 이렇게 치우치는 것은 매우 자주 일어납니다.
표본추출 방법에 따라 데이터에 편증이 생기는 것을 표본편향이고 합니다.
피실험자를 모집할때 응모한 사람들은 실험 참가에 의욕이 높거나 실험내용에 관심이 있기 때문에 치우친 표본이 될 가능성이 있습니다. 이것을 자발적 참여자 편향 이라합니다.
비지니스 분야에서는 확보하고 싶은 잠재고객의 데이터는 손에 넣기 어렵지만 이미 자사제품을 구입한 고객의 데이터를 통하여 기존고객의 관심과 요구를 잠재고객의 관심으로 추론한다고 해도 그대로 적용은 할 수 없습니다.
출판편향이라고 부르는 가설이 틀려도 우연히 가설에 맞는 결과가 나와버리는 경우 보고되는 선택편항이 생깁니다.
가설에 맞지 않는 데이터는 공개되지 않는 이런 상황에서는 이런 식으로 치우친 데이터가 공개되고 있을 가능성을 마음에 새겨 두어야 합니다.
선택 편향의 사례
조사에 따르는 탈락편향
장기간의 조사 중 실험자 사망
성공의 비결
전화 조사의 정부 지지율 조사
'수집 > IT' 카테고리의 다른 글
MRC 정리 (0) | 2022.12.10 |
---|---|
엘라스틱 서치 정리 (0) | 2022.12.10 |
이론분포 (0) | 2022.12.10 |
관측 개입에 의한 편향 (0) | 2022.12.08 |
측정기준에 관한 편향 (0) | 2022.12.08 |