Perbandingan Performa Algoritma Klasifikasi C4.5 dan Naïve Bayes untuk Prediksi Diagnosa Penyakit Diabetes
Abstract
Penyakit diabetes mellitus merupakan tantangan kesehatan global yang terus meningkat, ditandai oleh hiperglikemia akibat gangguan sekresi insulin atau resistensi insulin. Dengan meningkatnya jumlah penderita, penting untuk mengembangkan metode efektif dalam mendiagnosis dan memprediksi penyakit ini. Penelitian ini membandingkan performa dua algoritma klasifikasi, C4.5 dan Naïve Bayes, dalam memprediksi diagnosis diabetes menggunakan dataset dari UCI Machine Learning Repository yang terdiri dari 520 baris data dan 17 variabel. Metode penelitian menggunakan pendekatan CRISP-DM (Cross-Industry Standard Process for Data Mining) dan evaluasi performa model menggunakan metrik akurasi, presisi, dan recall yang diimplementasikan ke dalam pemrograman Python berbasis Web. Hasil menunjukkan bahwa C4.5 mencapai akurasi 100%, sedangkan Naïve Bayes mencapai 90,38%. Meskipun Naïve Bayes lebih cepat dalam waktu komputasi, C4.5 lebih unggul dalam akurasi prediksi. Kesimpulan penelitian menegaskan pentingnya pemilihan algoritma yang tepat berdasarkan karakteristik dataset dan tujuan analisis, dengan akurasi sebagai prioritas utama dalam diagnosis medis. Penelitian ini juga merekomendasikan eksplorasi algoritma tambahan seperti Random Forest atau Support Vector Machine untuk memahami performa dalam konteks yang lebih luas. Diharapkan, penelitian ini dapat menjadi acuan bagi praktisi kesehatan dan peneliti dalam meningkatkan akurasi diagnosis serta efektivitas intervensi medis untuk diabetes, serta mendorong penelitian lebih lanjut di bidang ini untuk meningkatkan kualitas layanan kesehatan dan deteksi dini penyakit diabetes.
