목차 Class imbalance When a dataset has a predictor variable that contains more instances of one outcome than another. majority class(많은 것) vs minority class(작은 것) class 안에서 majority와 minority의 balance가 맞지 않아도 된다. 문제가 생기는 경우는 majority class가 90% 이상을 차지 할 때 이다. 이 문제를 해결하기 위한 방법은 두 가지이다. 1) upsampling - dataset이 작을 때 유용하다. 2) downsampling - dataset이 매우 클 때 유리하다. 뽑는 방법은 랜덤 또는 수학 formula를 쓴다. Python1 ..