ols 3

10차시 다중선형회귀분석(multilinear regression), 다중공선성, vif, 허용오차, variance_inflation_factor, ols, matrices, 변수선택법

다중선형회귀분석 Multilinear regression 2개 이상의 독립변수가 종속변수에 미치는 영향을 추정하는 통계기법실제 세상에는 독립변수가 2개 이상인 경우가 많다. 종속변수에 영향을 미치는 요인이 여러 개이기 때문이다. 이런 경우 독립변수가 종속변수에 미치는 영향을 수치화하고, 이를 토대로 미래를 예측하기 위해 다중선형회귀분석(Multi linear regression model)을 사용한다.   Data preprocessing # ' . ' 포함되어 있는 것은 OLS formula적용이 안됨. data.columns = data.columns.str.replace('.', '')data.columnsIndex(['Unnamed: 0', 'Manufacturer',..

Kaggle 2024.04.23

9차시 회귀분석 단순선형회귀(simple linear regression), assumption, 결정계수, 회귀모델 및 회귀계수 통계적유의성, durbin watson, shapiro, scatterplot, rsquare, ols

목차 회귀분석 - 목적: 독립변수와 종속변수 간에 어떤 관계가 있는지 아는 것 변수 ★ Continuous variables Takes on any real value between minum and maximum value. 연속형 변수 ★ Categorical Variables Have a finite number of possible values 범주형 변수 ★ dependent variable.=Y response or outcome variable 종속변수 ★ Independet variable=X A variable that explains trends in the dependent variable = explanatory or predictor variable. 독립변수 수학적인..

Kaggle 2024.04.22

[linear regression] residual, SSR, OLS, linear regression assumption, linearity, normality, independent observation, Homoscedasticity, pairplot, r-squared, 결정계수

목차 A technique that estimates the linear relationship between one independent variable X, and one continuous dependent variable Y. 1. Linear regression equation 방정식 1) Best fit line 아래 식으로 수많은 선을 그릴 수 있지만 우리는 손실함수를 가장 최소로 하는 선을 그리고 싶다. 2) error 에러를 찾아야 한다 ★ Residual The difference betwe en observed or actual values and the predicted values(예상되는 값) of the regression line 엡실론= E 3) Sum of Suared R..