목차 decision tree 결정 트리라고 부른다. 수많은 데이터셋을 일정한 기준으로 계속하여 분류해 나가서, 최종적으로 가장 pure한 분류값을 얻는 게 목표이다. 어떻게 분류하는가? 이 말은 어떤 속성을 기준으로 분류하는가?와 같은 질문이다. 여러 개의 속성 attribute 중, 하나를 골라서 분류한다. 그 속성을 고르는 기준은 아래와 같다. less impurity(불순물), lower entropy, more predictiveness(예측) entropy measure of randomness(무작위성) or uncertainty(불확실성) 무작위성과 불확실성을 측정하여, 그 집단이 얼마나 동질성(균일성)을 갖는지 계산한다. ex)aaaaaab동질성(균일성) 높음, aabbaab동질성(균일성..