목차
산포도 measure of dispersion
- 두 집단의 대푯값이 같더라도 자료의 퍼짐 정도는 다르기 때문에 산포도를 함께 고려하는 것이 자료를 더욱 정확하게 분석할 수 있다.
- 개개의 관측값이 중심위치로부터 얼마만큼 떨어져 있는가를 나타내주는 척도
1) 범위
최댓값-최솟값
2) 사분위수 범위
IQR= Q3-Q1
3) 분산
-모든 자료들 간의 거리의 합
-자료들이 평균으로부터 얼마나 떨어져있는가?
4) 표준편차
5) 모분산과 표본분산
※ n대신에 n-1로 나누어 표본분산을 사용하는 이유
- 편차들의 합은 항상 0임 => 우리가 n-1개의 편차만 알고 있으면 나머지 한 개는 자연스럽게 알 수 있음.
- 즉, n-1개의 편차만 자유롭게 변할 수 있고, 나머지 한 개는 고정되어 있음.
- 여기에서, n-1을 자유도(degrees of freedom)라 부름
6) 변동 계수 coefficient of variation CV
단위와 크기가 다른 여러 자료의 산포 정도를 비교하는 상황에서 사용되는 상대적인 척도
자료의 측정단위에 의존하지 않는다.