Certificate/통계학

[통계] 산포도, 범위, 사분위수 범위, 분산, 표준편차, 모분산, 표본분산, 표본분산 n-1, 변동계수

Olivia-BlackCherry 2023. 5. 9. 12:11

산포도 measure of dispersion

- 두 집단의 대푯값이 같더라도 자료의 퍼짐 정도는 다르기 때문에 산포도를 함께 고려하는 것이 자료를 더욱 정확하게 분석할 수 있다. 

- 개개의 관측값이 중심위치로부터 얼마만큼 떨어져 있는가를 나타내주는 척도

 

1) 범위

최댓값-최솟값

 

 

2) 사분위수 범위

IQR= Q3-Q1

출처: 통계교육원 강의(이하 동일)

 

3) 분산

-모든 자료들 간의 거리의 합

-자료들이 평균으로부터 얼마나 떨어져있는가?

 

4) 표준편차

 

 

5) 모분산과 표본분산

 

※ n대신에 n-1로 나누어 표본분산을 사용하는 이유

- 편차들의 합은 항상 0임 => 우리가 n-1개의 편차만 알고 있으면 나머지 한 개는 자연스럽게 알 수 있음.

- 즉, n-1개의 편차만 자유롭게 변할 수 있고, 나머지 한 개는 고정되어 있음.

- 여기에서, n-1을 자유도(degrees of freedom)라 부름

 

 

6) 변동 계수 coefficient of variation CV

단위와 크기가 다른 여러 자료의 산포 정도를 비교하는 상황에서 사용되는 상대적인 척도 

자료의 측정단위에 의존하지 않는다.