분류 전체보기 603

help 함수 쓰는 방법

help() 함수 사용 방법함수/모듈/클래스의 설명, 매개변수, 반환값 등 자세한 정보를 제공한다.사용 예시와 관련 문서 링크도 포함될 수 있다. 1. help(object)object에는 함수, 모듈, 클래스 등 다양한 객체를 넣을 수 있습니다. 예시: help(print), help(pandas.DataFrame), help(os.path.join) 2. 모듈 내 함수 사용법 확인 help(모듈.함수) 예시: help(pandas.DataFrame.rename) 3. 문자열로 객체 지정 객체 이름을 문자열로 전달할 수 있습니다. 예시: help("pandas.DataFrame.rename")  sklearn 모듈에서 help() 함수 사용하기1. 모듈 내 함수 사용법 확인 help(sklearn.함수..

Kaggle 2024.04.27

14차시 분류 평가지표, score(), accuracy, precision, recall, confusion_matrix, binarizar, predict_proba, f1 score, roc, auc, roc_auc

목차 1. model.score(x_test, y_test)모델의 성능을 평가하는 데 사용.x_test, y_test 테스트 데이터를 가지고 모델의 기본 성능 지표를 반환하는데, 성격에 따라 다른 평가 지표를 활용함- 분류모델 : accuracy- 회귀모델 : R2  2. accuracy_score(y_test, y_pred)정확도만 반환함대부분 분류모델에서는 model.score()와 accuracy_score()은 유사한 값을 반환함  예시 데이터  데이터 스케일링from sklearn.preprocessing import StandardScalerscaler= StandardScaler()data_scaled = scaler.fit_transform(x)data_scaled array([[ 1.09..

Kaggle 2024.04.27

13차시 선형회귀모델 스케일링, 정규화작업, standardscaler(), minmaxscaler(), polynomialfeature(), log변환, log transformation, log1p(), np.log1p()

목차  선형회귀모델은 기본적으로 독립변수와 종속변수 사이에 선형 관계가 있다고 가정하고, 최적의 선형함수를 찾아 모델을 만들고 결과값을 예측한다. 하지만 데이터 분포가 심하게 왜곡되어 있거나, 각 데이터별로 값 차이가 크다면 예측 성능에 부정적이다. 보편적으로 선형회귀 모델의 경우 데이터의 분포가 정규 분포 형태를 띄면 예측 성능이 좋다. 따라서 데이터를 정규 분포 형태로 바꿔주는 스케일링 & 정규화 작업을 수행하는 것이 좋다.   # ' . ' 포함되어 있는 것은 OLS formula적용이 안됨. data.columns = data.columns.str.replace('.', '')data.columnsX= data[['EngineSize', 'RPM', 'Weight', 'Length', 'MPGci..

Kaggle 2024.04.26

12차시 다항 회귀 polynomial Regression, subplot, 차원, plt.setp, polynomialfeatures, 시각화, tradeoff, overfit, 규제화, regularization, ridge, lasso, elasticnet, concatenate, pd.concat, reset_index()

목차  다항회귀 ?데이터가 단순한 직선형태가 아니라 비선형의 형태일 때, 각 독립변수의 거듭제곱을 새로운 변수로 추가하면 선형 모델을 사용할 수 있다. 즉, 독립변수가를단항식이 아닌 2차, 3차 방정식과 같은 다항식으로 표현됨.단, 독립변수는 비선형 형태가 되지만 다항회귀 자체는 여전히 선형회귀이다. 회귀계수가 여전히 선형이기 때문이다.ex) 나이에 따른 보험가격에 대한 회귀선 ---> 나이(X)를 거듭제곱하여 새로운 독립변수로 만듬 # train/test data splitfrom sklearn.model_selection import train_test_splitx_train, x_test, y_train, y_test = train_test_split(x,y, test_size=0.3, random..

Kaggle 2024.04.26

11차시 선형회귀(머신러닝) 총정리, ravel(), 교차분석, scoring, neg_mean_squared_error, mae, mse, rmse, gradient descent, SGDregression

목차  공통목표문제해결 접근방법파이썬 코드통계적 방식 회귀분석MSE(평균제곱오차)를 최소화하는 파라미터 찾기정규방정식OLSsklearn > LinearRegression()머신러닝 모델 회귀분석경사하강법        경사하강법 Gradient Descent- 손실함수의 값이 낮아지는 방향으로 독립변수의 값을 바꿔가는 방식이다. 최적의 해법을 찾을 수 있는 최적화 알고리즘으로, 손실함수 값을 최소화하기 위해 파라미터를 반복적으로 조정해나간다. - Random Initialization 방식으로 임의의 값으로 시작해 한번에 조금씩 함수의 값이 감소하는 방향으로 최솟값에 수렴할 대까지 점진적으로 진행- 학습률 : 학습 스텝의 크기 - 종속변..

Kaggle 2024.04.24