Postingan

Menampilkan postingan dari Oktober, 2021

Klasifikasi Naive Bayes

Gambar
Pada blog sebelumnya, kita telah membahas mengenai pemanfaatan machine learning, salah satunya untuk memprediksi. Sebenarnya memprediksi itu bisa ditarik ke arah regresi ataupun klasifikasi, hanya bedanya kalau regresi output-nya adalah numerik (berupa angka-angka) sedangkan klasifikasi output-nya berupa kategorikal (bisa binary atau multiclass). Dimana binary class itu hanya 2 pilihan (yes/no, on/off, 0/1, hitam/putih, dan lain sebagainya) sedangkan pada multiclass itu jika pilihannya atau keputusannya ada 3, 4, 5, dan seterusnya (jadi lebih besar dari 2). Terdapat beberapa model yang bisa digunakan untuk mengklasifikasi dataset yaitu: Naive Bayes (NB). Pada model ini terkait dengan probabilitas (kemunculan suatu kelas dari data yang ada) K Nears Neighbords (KNN), intinya adalah melihat tetangga terdekat dari data yang ada. Decision Tree (DT), intinya adalah melihat percabangan pohon terakhirnya menuju ke kelas yang mana. Support Vector Machine (SVM), kerjanya yaitu kita coba membuat ...

Pengantar Machine Learning & Regresi Linear

Gambar
Data science adalah bidang ilmu yang merangkum atau terdiri dari berbagai macam bidang ilmu pengetahuan. Garis besar bidang utamanya yaitu matematika dan statistik, computer science/IT, domains/business knowledge. Ketika matematika dan statistic bergabung dengan computer science/IT maka akan menghasilkan ilmu machine learning. Machine learning yaitu pemrosesan data menggunakan matematika dan statistic serta program komputer. Bahan utama machine learning adalah data (data yang diproduksi dapat mencapai zetta atau bahkan lebih). Beberapa bidang yang dapat menghasilkan banyak data yaitu sosial media, sensor, GPS, WEB, dan sebagainya. Data terbagi atas dua bagian yaitu data yang structured dan unstructured. Data structured biasanya sudah tertabulasi dan lebih mudah didata contohnya spreadsheets, XML, AXL, dan file-file yang terkait dengan database. Sedangkan data unstructured biasanya lebih ke data-data teks contohnya data yang biasanya di WEB, emails, blogs, atau sebagainya. Menurut K...