Certificate/통계학

[통계] 산포도, 범위, 사분위수 범위, 분산, 표준편차, 모분산, 표본분산, 표본분산 n-1, 변동계수

Olivia-BlackCherry 2023. 5. 9. 12:11

목차

    산포도 measure of dispersion

    - 두 집단의 대푯값이 같더라도 자료의 퍼짐 정도는 다르기 때문에 산포도를 함께 고려하는 것이 자료를 더욱 정확하게 분석할 수 있다. 

    - 개개의 관측값이 중심위치로부터 얼마만큼 떨어져 있는가를 나타내주는 척도

     

    1) 범위

    최댓값-최솟값

     

     

    2) 사분위수 범위

    IQR= Q3-Q1

    출처: 통계교육원 강의(이하 동일)

     

    3) 분산

    -모든 자료들 간의 거리의 합

    -자료들이 평균으로부터 얼마나 떨어져있는가?

     

    4) 표준편차

     

     

    5) 모분산과 표본분산

     

    ※ n대신에 n-1로 나누어 표본분산을 사용하는 이유

    - 편차들의 합은 항상 0임 => 우리가 n-1개의 편차만 알고 있으면 나머지 한 개는 자연스럽게 알 수 있음.

    - 즉, n-1개의 편차만 자유롭게 변할 수 있고, 나머지 한 개는 고정되어 있음.

    - 여기에서, n-1을 자유도(degrees of freedom)라 부름

     

     

    6) 변동 계수 coefficient of variation CV

    단위와 크기가 다른 여러 자료의 산포 정도를 비교하는 상황에서 사용되는 상대적인 척도 

    자료의 측정단위에 의존하지 않는다.