Perbandingan Algoritma Support Vector Machine dan Random Forest dalam Mendeteksi Penyakit Diabetes
Abstract
Salah satu penyakit yang sangat diperhatikan dan banyak kasus yang terjadi diseluruh dunia karena dampaknya yang sangat siginfikan yaitu diabetes. penederita diabetes mengalami gangguan pada metabolisme yang mengidentifikasi hiperglikemia yang diakibatkan oleh tidak mampunya pancreas untuk mensekresi insulin yang berdampak menyebabkan kematian karena tidak berfungsinya organ tubuh yang lain. Data menyatakan pada tahun 2019 bahwa 433 juta orang terdiagnosa diabetes dan jumlahnya diprediksi meningkat hingga puncaknya pada tahun 2045 menjadi 700 juta orang. Hal ini perlu diantisipasi secepat mungkin oleh masyarakat dengan beberapa ciri yang terjadi pada penderita. Data penderita diabetes ini dapat diolah dengan data mining yang memanfaatkan machine learning untuk mendeteksi penyakit diabetes. Penelitian ini akan membandingkan dua algoritma yaitu Support vector machine dan Random Forest untuk menemukan hasil yang akurat. Peneliti menggunakan model KDD (Knowledge Discovery in Database) dalam beberapa tahap seperti data selection, preprocessing, Transformation dan Evaluation. Dataset yang digunakan bersumber dari website kaggel.com sebanyak 768 yang terdiri 500 negatif dan 268 positif diabetes. Pada algoritma SVM dengan kernel linear mengasilkan nilai akurasi 77%, presisi 75% dan recall 51%. Sedangkan untuk algoritma Random Forest dengan n_estimators=100, random_state=42 menghasilkan nilai akurasi 75%, presisi 69%, recall 55% dan F1 score 61%. Dari proses dan hasil diatas menyatakan bahwa algoritma SVM lebih cocok digunakan untuk mendeteksi penyakit diabetes. Model yang telah dibuat menggunakan Bahasa pemrograman python ini akan diimplementasikan dengan stremlit agar dapat digunakan berbasis web.
