Agglomerative Hierarchical Clustering (AHC)


Hierarchical Clustering adalah metode analisis kelompok yang berusaha untuk membangun sebuah hirarki kelompok data. Strategi pengelompokkannya umumnya ada 2 jenis yaitu Agglomerative (Bottom-Up) dan Devisive (Top-Down). Namun kali ini kita hanya akan membahas tentang konsep Agglomerative (Bottom-Up).


Berikut proses algoritma AHC (Agglomerative Hierarchical Clustering) : 

1.    Hitung matrik jarak antar data (menggunakan Euclidean atau Manhattan Distance).

2.    Gabungkan dua kelompok terdekat menjadi satu kelompok data:

·    Single Lingkage (Jarak Terdekat)

·    Complete Lingkage (Jarak Terjauh)

·    Average Lingkage (Jarak Rata-Rata)

3.  Perbarui matrik jarak antar data untuk mempresentasikan antara kelompok baru dengan kelompok yang masih tersisa

     4.   Ulangi langkah 2-3 sampai hanya satu kelompok yang tersisa


Single, Averages & Complete Linkage
  • Single : Jarak antara member terdekat dari dua cluster
  • Complete : Jarak antara member terjauh dari dua cluster
  • Average : Jarak rata-rata antara cluster
Berikut gambaran dari ketiganya :


Contoh Soal

Kelompokkan dataset di bawah ini dengan menggunakan metode AHC (Single Linkage) dengan Mahattan Distance.

Dataset Skor Kedisiplinan Siswa

Langkah 1
  • Hitung matrik jarak antar data
  • Menghitung jarak dua data secara berpasang-pasangan dengan menggunakan Manhattan Distance




Langkah 2

  • Gabungkan dua kelompok terdekat menjadi satu
  • Menggunakan Single Linkage pilih jarak dari dua kelompok yang terdekat
  • Terpilih kelompok 2 dan 3, sehingga kedua kelompok digabungkan
  • Menghitung jarak terdekat antar kelompok (2 dan 3) dengan kelompok yang tersisa, yaitu 1, 4, 5


Langkah 3
  • Perbarui matrik jarak antar data
  • Hasil matriks jarak penggabungan kelompok 2 dengan kelompok 3
      


Langkah 4
  • Gabungkan dua kelompok terdekat menjadi satu
  • Pilih jarak dua kelompok terdekat
    
  • Terpilih kelompok 1 dan 4, sehingga kedua kelompok digabungkan
  • Menghitung jarak terdekat antar kelompok (1 dan 4) dengan kelompok yang tersisa, yaitu {23} dan 5
   


Langkah 5
  • Perbarui matrik jarak antar data
  • Hasil matriks jarak penggabungan kelompok 1 dengan kelompok 4
      


Langkah 6
  • Gabungkan dua kelompok terdekat menjadi satu
  • Pilih jarak dua kelompok terdekat
    
  • Terpilih kelompok 1 dan 4, sehingga kedua kelompok digabungkan
  • Menghitung jarak terdekat antar kelompok (1 dan 4) dengan kelompok yang tersisa, yaitu {23} dan 5
    


Langkah 7
  • Perbarui matrik jarak antar data
  • Hasil matriks jarak penggabungan kelompok {23} dengan kelompok {14}
     
  • Kelompok (1234) dan 5 digabung menjadi kelompok tunggal dari lima data, yaitu kelompok (12345) dengan jarak terdekat 5
  • Hasil Clustering dengan AHC
   








Sekian dari saya, terimakasih cantik/ganteng sudah berkunjung di blog saya 😊

Komentar

Postingan populer dari blog ini

Klasifikasi Support Vector Machine (SVM)

Klasifikasi Naive Bayes

Neural Network