f1 score 3

14차시 분류 평가지표, score(), accuracy, precision, recall, confusion_matrix, binarizar, predict_proba, f1 score, roc, auc, roc_auc

목차 1. model.score(x_test, y_test)모델의 성능을 평가하는 데 사용.x_test, y_test 테스트 데이터를 가지고 모델의 기본 성능 지표를 반환하는데, 성격에 따라 다른 평가 지표를 활용함- 분류모델 : accuracy- 회귀모델 : R2  2. accuracy_score(y_test, y_pred)정확도만 반환함대부분 분류모델에서는 model.score()와 accuracy_score()은 유사한 값을 반환함  예시 데이터  데이터 스케일링from sklearn.preprocessing import StandardScalerscaler= StandardScaler()data_scaled = scaler.fit_transform(x)data_scaled array([[ 1.09..

Kaggle 2024.04.27

[Azure] 분류 모델 평가지표 confusion metrics, Recall, sensitivity, Precision, TPR, FPR, Specificity, roc curve, F1 score

목차 머신러닝에서 분류는 지도학습의 일종이다. 정해진 레이블값이 있고, 설계된 모델에 따라 레이블값을 기준으로 학습을 해서 모델을 만든다. 그리고 이 모델이 잘 만들어진 모델인지 검사해야하는데, 이때 척도로서 중요하게 여겨지는 것이 confusion metrics이다. 1. confusion metrics confusion metrics는 한국에서는 혼동 메트리스라고 불린다. 처음에는 이해하기가 어렵지만, 여러번 시간차를 두고 개념을 여러번 익혀나간다면 누구라도 결국엔 이해할 수 있다. 우선 confusion metrics를 배우고나면, 이것을 왜 하는지에 대한 의문이 든다. 예를 들어보자. 인공지능 모델 중 분류에 대한 모델을 만든다. 여러 모델이 있다. 어떤 모델은 특정 메일을 보고 이것이 스팸인지 ..

classification, KKN(k-nearest neighbors), evaluate metrics, f1 score, log loss, Jaccard index

목차 classification 분류 모델 분류 모델은 지도방법에 속한다. 아이템들을 서로 다른 카테고리나 클래스로 분류하는 작업이다. target attribute는 categorical한 variable로 binary하거나 multi한 클래스로 분류할 수 있다. machine learning에는 다양한 종류의 알고리즘이 있다. decision trees, Naive Bayes, linear discriminant analysis, k-nearest neighbor, logistic regression, neural networks, support vector machines 1) K-nearest Neighbours(KNN) K 이웃의 수 nearest neighbors 가까운 이웃이다. 먼저 k 숫..