Certificate/통계학 14

[통계] 대푯값, 산술평균, 중위수, 최빈값, 기하평균, 조화평균, 절사평균

목차 1. 대푯값 자료의 특성에 맞게 자료를 전체 요약할 수 있는, 적절한 대푯값을 사용해야 한다. 자료의 중심적인 경향, 자료 분포의 위치를 대략적으로 알려줌 1) 산술평균 -보편적 평균 2) 중위수=중앙값 median -위치적으로 중간 3) 최빈값 -질적 자료에서 많이 쓰임. 가장 많이 나온 값 4)기하평균 geometric mean -우리가 일상에서 사용하는 척도가 덧셈으로만 이루어져 있지 않다. 물가 상승률, 인구증가율과 같이 '변화하는 비율'을 나타낼 때는 기하평균을 이용한다. - 변하는 비율을 산술평균으로 단순 계산했을 때 문제점 5)조화평균 조화평균(harmonic mean)은 평균속도를 계산하거나 일정금액을 가지고 구입할 수 있는 상품의 수량의 평균을 구할 때 이용되는데, 자료값을 각각 역..

[통계] 자료, 이산형 자료, 연속형 자료, 명목형 자료, 순서형 자료, 변수, 다변량 자료, 막대그래프, 원그래프, 도수분포표, 히스토그램, 줄기잎그림, 사분위수, 다섯 수치 요약, 상자그램, 산점..

목차 통계분석방법 자료의 속성과 분석 목적에 따라 달라진다. 자료 variation 변동을 표현하는 중요한 수단으로, 좁은 의미에서는 숫자들을 모아놓은 집합이다. 빅데티어 시대에는 다양한 형태(이미지, 텍스트, 영상)의 자료가 쏟아져 나오기 때문에 이를 분석하려는 요구가 증가하고 있다. 비정형 자료는 각종 전처리 작업으로 자료를 정형화시켜 숫자로 만들어 통계분석에 활용한다. 1) 양적 자료: 연속형(셀 수 없음), 이산형 자료(셀 수 있음)--> 수치로 표현할 수 있음 - 이산형자료(discrete data): 관측값들을 셀 수 있는 자료 (예) 교통사고 건수, 자녀수, 에어컨 생산대수 등 - 연속형자료(continuous data): 관측값들을 셀 수 없고 연속적인 구간의 값을 갖는 자료 (예) 신장이..

[통계] 표본조사, 표본추출, 표본오차, 비표본오차, 단순랜덤추출법, 층화랜덤추출법, 집락추출법, 계통추출법

목차 표본조사 또는 표본추출(sampling) 전체인 모집단으로부터 부분인 표본을 뽑는 일련의 행위 혹은 과정 - 대표성(표본이 모집단과 비슷하게 추출되었는가?, 모집단의 특성 추론할 수 있어야 함) - 적절성(시간, 비용의 절약) 조사자의 편견이 들어가지 않고, 충실히 전체를 대표할 수 있는 표본을 선정해야 한다. · 제한된 비용 내에서 가장 효과적인 필요한 정보를 얻을 수 있어야 한다. · 표본이 어떤 층을 포함하는가 또는 포함하지 않는가를 분명히 알아야 한다. · 반드시 절대적으로 커야하는 것은 아니지만, 표본의 크기는 통계적인 신뢰도를 확보할 수 있을 만큼 커야 한다. · 가급적 표본은 현지에서 현지조사원이 뽑는 것이 아니라, 연구실에서 충분한 자료를 토대로 일정한 절차 에 따라 뽑아야 한다. ·..

[통계] 통계학, 모집단, 표본, 모수 , 통계량, 통계치, 기술 통계학, 추측 통계학

목차 통계학(statistics)이란? 주어진 문제에 대하여 합리적인 답을 이끌어내기 위해 숫자로 표시되는 정보 (자료:data)를 수집·정리하고 분석하며 이를 해석하고 신뢰성 있는 결론을 이끌어내는 일련의 과정을 연구하는 학문이다. 통계학의 주된 과제는 자료를 수집하는 방법, 자료를 분석하는 방법, 자료로부터 얻은 결론에 대한 객관성을 보장하는 방법 모집단(population) 주어진 문제에서 관심의 대상이 되는 전체집단 ex) 유권자 전체 전체를 구성 하는 각 개체를 추출단위(sampling unit)라 하며, 추출단위가 유한인 경우 유한모집단(finite population)이라 하며, 추출단위가 무한인 경우를 무한모집단(infinite population)이라 한다 표본(sample) 모집단의 특..