Klasifikasi Decision Tree



Decision Tree adalah model klasifikasi yang menggunakan struktur pohon, dimana setiap node mempresentasikan atribut dan cabangnya mempresentasikan nilai dari atribut, sedangkan daunnya digunakan untuk mempresentasikan kelas.

Berikut contoh dari model klasifikasi decision tree:


Dari data tersebut, terdapat 4 atribut (nilai x) yaitu age, income, student dan credit rating. Kelas (nilai y) pada data tersebut adalah buys computer dimana ada 2 kelas (binary class) yaitu yes dan no. Yang menjadi root (akar) pada data tersebut adalah age.

Terdapat 4 tahapan algoritma decision tree, antara lain sebagai berikut:

1.    Siapkan data training

2.    Pilih atribut sebagai akar

3.    Buat cabang untuk tiap-tiap nilai

4.    Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama


Agar lebih jelas uraian di atas, perhatikan contoh berikut:

  • Siapkan data training

  • Pilih atribut sebagai akar

Untuk memilih atribut akar, didasarkan pada nilai Gain tertinggi dari atribut-atribut yang ada. Untuk mendapatkan nilai Gain, harus ditentukan terlebih dahulu nilai Entropy

Untuk menghitung Entropy dan Gain Akar, agar lebih mudah perhitungannya, kita dapat membuat menggunakan excel seperti berikut:

Berikut perhitungan Entropy Akar

Berikut setelah dirapikan di excel:

Setelah itu kita dapat menghitung Gain Akar sebagai berikut:

Berikut setelah dituangkan dalam excel:

Dari hasil pada Node 1, dapat diketahui bahwa atribut dengan Gain tertinggi adalah HUMADITY yaitu sebesar 0.37051. Dengan demikian HUMADITY dapat menjadi node akar.

·       Buat cabang untuk tiap-tiap nilai

Untuk memudahkan, dataset di filter dengan mengambil data yang memiliki kelembaban HUMADITY = HIGH untuk membuat table Node 1.1 sebagai berikut:

Berikut perhitungan Entropy dan Gain Cabang

Gain tertinggi sebagai Node 1.1 adalah sebagai berikut:

·       Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama

Gain tertinggi sebagai Node 1.1.2 adalah sebagai berikut:









Sekian dari saya, terimakasih cantik/ganteng sudah berkunjung di blog saya 😊

Komentar

Postingan populer dari blog ini

Klasifikasi Support Vector Machine (SVM)

Klasifikasi Naive Bayes

Neural Network