교차분석 3

11차시 선형회귀(머신러닝) 총정리, ravel(), 교차분석, scoring, neg_mean_squared_error, mae, mse, rmse, gradient descent, SGDregression

목차  공통목표문제해결 접근방법파이썬 코드통계적 방식 회귀분석MSE(평균제곱오차)를 최소화하는 파라미터 찾기정규방정식OLSsklearn > LinearRegression()머신러닝 모델 회귀분석경사하강법        경사하강법 Gradient Descent- 손실함수의 값이 낮아지는 방향으로 독립변수의 값을 바꿔가는 방식이다. 최적의 해법을 찾을 수 있는 최적화 알고리즘으로, 손실함수 값을 최소화하기 위해 파라미터를 반복적으로 조정해나간다. - Random Initialization 방식으로 임의의 값으로 시작해 한번에 조금씩 함수의 값이 감소하는 방향으로 최솟값에 수렴할 대까지 점진적으로 진행- 학습률 : 학습 스텝의 크기 - 종속변..

Kaggle 2024.04.24

8차시 chi-square, 카이제곱 총정리, 교차분석, 카이제곱 검정, 적합성, 독립성, 동일성 검정, stats.norm(), stats.chi2(), pdf(), isf(), repeat(), stats.chisquare(), chi2_contingency()

목차 카이제곱분포 Z1~Zn이 서로 독립이고 정규분포를 따를 때, 그 제곱합의 확률분포가 자유도 n인 분포 뜻한다. 제곱의 분포이기 때문에 카이제곱분포는 모두 0이상인 실수 값을 취한다. 자유도 n에 따라 분포 형태가 달라지는데, n이 커질 수록 정규분포 형태에 가까운 좌우대칭 모습을 보인다. 1) 확률변수, 표본 생성 ♡ stats.norm() 평균0, 표준편차1인 정규분포를 나타내는 확률변수 생성하는 함수 ♡ 확률변수.rvs((n, samplesize) 지정된 확률분포에서 생성한 확률변수 중 무작위 표본을 생성하는 데 사용함. n은 생성할 표본의 차원, samplesize는 각 차원별로 생성할 표본의 수 import scipy.stats as stats impor..

Kaggle 2024.04.13

[ADP 데이터분석 전문가- 통계편] 카이제곱 분포, 교차분석, 카이제곱 검정, 적합성검정, 독립성검정, 동일성검정, chi-squared

목차 1. 카이제곱 분포 chi-square distribution 카이제곱 분포는 추정과 검정에서 사용하는 어떠한 형태를 하고 있는 특수한 확률분포이다. t-test에 사용한 t분포, 분산분석에서 사용한 f분포 역시 어떠한 형태를 하고 있는 특수한 확률분포의 일종이다. 오늘은 카이제곱 분포가 어떤 형태를 하고 있는지, 정규분포와 어떤 관련성을 맺고 있는지에 대해 설명하고 교차분석과 카이제곱 검정을 진행해보겠다. 1) 정의 Z1~Zn이 서로 독립이고 N(0,1)을 따를 때, 그 제곱합의 확률분포가 자유도가 n인 카이제곱분포라고 한다. 2) 표기 χ²(n) 3) 범위 제곱이라는 말에서도 알 수 있듯이, 카이제곱분포가 취할 수 있는 값은 0이상인 실수. 4) 파이썬 구현 표준정규분포에서 표본 크기 10으로 ..

Certificate/ADP 2023.10.20