Certificate/통계학

[통계] 표본분포, 표본평균의 분포, 표본분산의 분포, 중심극한의 정리, 통계량, 모수, 모집단,랜덤표본

Olivia-BlackCherry 2023. 5. 10. 12:37

목차

    모집단

    관심있는 연구 대상의 전체 집단

    연구 대상의 특성에 대한 모든 값의 집합

    출처: 통계교육원 강의(이하 동일)

     

    모수 parameter

    모집단의 특성을 나타내는 수

     

    랜덤표본 random sample

    집단의 일부를 표본이라 부르며,

    모집단에서 독립적으로 뽑힌 표본을 랜덤표본 혹은 확률표본 또는 임의표본이라 함

    iid : independent identically distributed 독립적으로 동일한 분포에서 표본 추출

    X1~Xn은 서로 독립이고 동일한 분포를 따름

     

     

    통계량 staticstic

    표본으로부터 계산 가능한 표본의 특성값

    랜덤표본의 함수로 통계량은 확률변수들의 함수이므로 확률변수임

     

     

    표본분포

    통계량의 확률분포를 표본분포라 함

    ex) 표본평균의 분포, 표본분산의 분포, 표본비율의 분포

     

    sampling distribution

    통계량의 분포(표본의 분포X)로, 통계량이란 표본으로부터 계산되어지는 값이다. 

    표본평균들이 흩어지는 정도

    표본평균의 분포

     

    예컨데, 전교생이 1000명인 학교의 학생 중 50명의 학생들을 추출하여, 평균 하루 공부시간을 조사하였더니 10시간이 나왔다.

    모집단: 전교생 1000명

    모수: 하루 평균 공부시간

    표본: 50명

    통계량: 50명으로부터 계산되어진 값으로 50명의 하루 평균 공부시간

     

    앞의 연구가 타당할까?

    만약 50명의 다른 표본을 추출하면 하루 평균 공부시간이 10시간이 아니라 13시간이 나올 수도 있다. 

     

    이 연구가 타당하다고 말하려면, 표본평균들이 흩어진 정도가 얼마나 되는지를 밝혀줘야 한다. 

    그것이 곧 표본분포이다. 

    +표본평균의 분포

    뽑힌 표본에 따라 값이 달라지므로 분포를 가진다.

     

    + 표본분산

    뽑힌 표본에 따라 값이 달라지므로 분포를 가진다. 

     

    +통계량

    표본평균, 표본분산과 같이 표본으로부터 계산 가능한 함수, 

    즉 표본에 따라 값이 변하는 확률변수

     

    +표본분포

    통계량의 분포

     

    1) 모집단 X의 분포가 정규분포일 때, 표본평균의 분포도 정규분포를 따른다.

     

    2) 임의의 모집단에서 표본평균의 분포

    -> 정규분포를 따르거나, 따르지 않는 경우 모두 

    위와 동일하게 표본평균의 분포를 구할 수 있다. 

    -중심극한의 정리에 따라

     

     

     

     

    중심극한정리 central limit theorem

    임의의 모집단에서 랜덤표본의 평균의 분포는 표본의 크기가 충분히 클 때, 정규분포를 따른다.