
Một loại thuật toán supervised learning được sử dụng chủ yếu cho các vấn đề phân loại. Nó hoạt động cho cả hai biến phụ thuộc phân loại và biến phụ thuộc liên tục. Trong thuật toán này, ta chia “population” thành hai hoặc các nhóm tập hợp. Điều này được thực hiện dựa trên các biến thuộc tính quan trọng nhất / các biến độc lập để phân loại các groups có thể được.
Trong hình bên dưới, bạn có thể thấy popullation được chia làm 4 nhóm khác nhau dựa trên nhiều thuộc tính đã xác định họ có được “Get loan” hay không? Để chia popullation thành các nhóm đồng nhất khác nhau, có các kỹ thuật như Gini, Infomation gain, Chi-square, Entropy.

up cumin:
Decision Trees: Explained in Simple Steps
Tree Based Algorithms: A Complete Tutorial from Scratch (in R & Python)