Certificate/ADP 13

[ADP 데이터분석 전문가- 통계편] 분산분석, ANOVA, 일원배치, 이원배치, two-way ANOVA, Kruskal, welch ANOVA, tuekeyhsd, 튜키, 교호작용, 주효과

목차 1. 분산분석이란? 분산분석은 다수( 2,3,4개 ..) 집단 간 평균을 비교한다. 독립변수 : 범주형 종속변수 : 연속형 2. 종류 영향을 주는 독립변수의 개수에 따라 1 ANOVA 일원배치 분산분석 2 Two-way ANOVA 이원배치 분산분석 3개 이상 MANOVA 다원배치 분산분석 ※ 종속변수의 개수에 따라 아래와 같이 분류도 가능함. 1: 단일변량 분산분석 2개 이상: 다변량 분산분석 3. ANOVA 일원배치 분산분석 1) EDA import numpy as np import pandas as pd df=pd.read_csv('iris.csv') df.head() EDA를 해보자. 타겟 벨류가 세 가지가 있으며, 데이터는 균형적이다. 2) ANOVA - 개념 - 여러 개의 집단에서, 하나의..

Certificate/ADP 2023.10.19

[ADP 데이터분석 전문가- 통계편] t-test, 윌콕슨 부호순위, 샤피로, one sample ttest, paired sample ttest, independent ttest

목차 통계파트 흐름 문제정의> 데이터수집> 데이터탐색 및 전처리> 데이터 변환/정제 >통계모형수립> 모형 적합검정> 모형 평가> 결론 도출 가장 중요한 것은 통계모형수립이다. 기초통계지식을 가지고, 데이터에서 내가 원하는 결론을 도출하기 위해 올바른 통계모형을 수립하는 것이 중요하다. 기본 통계 용어 1. 모집단: 전체 집단, 원래 집단을 말한다. 연구자가 알고싶어 하는 집단이다. 모집단을 모두 조사하는 것을 전수조사라고 한다. 대한민국 인구가 모집단이 될 수 있다. 하지만 양이 방대하기 때문에 현실적으로 불가능하다. 2. 표본집단: 따라서 모집단의 성질을 대표할 수 있는 일부만 표본으로 추출하여 조사한다. 연구자가 측정 또는 관찰할 집단이다. 3. 모수: 우리가 알고 싶은 것은 모집단의 성질이다. 예를..

Certificate/ADP 2023.10.18

ADP 데이터분석 전문가 시험유형 분석과 공부방법, 응시 가이드, FAQ

목차 ADP 실기시험은 합격률이 3%가 되지 않을 정도로, 어려운 시험이다. 범위가 넓을 뿐만 아니라, 데이터분석 전반에 관하여 이해하고 있지 않다면 문제를 풀 수 없다. 기출문제로 유형을 익힐 수 있지만, 답을 외울 수는 없다. ADP 실기시험은 일년에 2번, 4시간, 오픈북 형태, 필기도구 지참은 불가능하고 인터넷 없이 컴퓨터 파일로 작성하여 pdf 형식으로 제출한다. 오픈북이 좋은 것 같지만, 오픈북으로 시험을 응시해도 떨어지는 수험생이 97%라고 하면 얼마나 어려운 시험인지 감이 올 것이다. 1. ADP 시험 유형 분석 총 2파트로 나뉜다. 머신러닝과 통계분석이다. 각각 50점이다. 1) 머신러닝 EDA> 전처리> 모델링> 해석 구조로 다소 정형화된 형태로 출제된다. 최근에는 EDA, 전처리 부분..

Certificate/ADP 2023.10.18