Perbandingan Akurasi Metode Naive Bayes dan Metode Random Forest dalam Mendiagnostik Penyakit Kanker Payudara

Authors

  • Nisaur Rohmah Universitas Trunojoyo Madura
  • Eka Ayu Safitri Universitas Trunojoyo Madura
  • Cici Alinta Universitas Trunojoyo Madura
  • Yuyun Oktalina Universitas Trunojoyo Madura
  • Wahyudi Setiawan Universitas Trunojoyo Madura

DOI:

https://doi.org/10.25273/doubleclick.v8i2.20383

Keywords:

kanker payudara, naive bayes, random forest, data mining

Abstract

Kanker payudara merupakan penyakit yang mempunyai dampak signifikan terhadap kesehatan wanita di seluruh dunia. Dalam penelitian ini, kami menggunakan data dari kumpulan data Wisconsin Diagnostic untuk membandingkan kinerja dua metode klasifikasi dalam diagnosis kanker payudara: Naive Bayes dan Random Forest. Metode Naive Bayes menggunakan pendekatan probabilitas sederhana untuk mengklasifikasikan data, sedangkan Random Forest membuat beberapa pohon keputusan dan menggabungkannya untuk meningkatkan akurasi prediksi. Sebelum membandingkan performa kedua algoritma, dilakukan proses preprocessing data yang meliputi identifikasi fitur, deteksi outlier, dan normalisasi. Kedua algoritma tersebut dilatih dan diuji menggunakan data dari dataset Wisconsin Diagnostic yang terdiri dari 569 sampel dengan 32 atribut dan 2 kelas. Hasil pengujian menunjukkan bahwa Naive Bayes menghasilkan akurasi sebesar 0.932, precision sebesar 0.933, recall sebesar 0.931, dan F1-score sebesar 0.932. Sedangkan Random Forest menghasilkan akurasi sebesar 0.9442, precision sebesar 0.945, recall sebesar 0.944, dan F1-score sebesar 0.944. Dalam konteks ini, Random Forest sedikit lebih akurat dibandingkan Naive Bayes, namun keduanya baik untuk mendiagnosis kanker payudara jinak dan ganas. Penelitian ini memberikan wawasan tentang efektivitas Naive Bayes dan Random Forest dalam membantu diagnosis kanker payudara berdasarkan kumpulan data klinis modern. Meskipun hasilnya menunjukkan bahwa Random Forest lebih unggul dalam hal akurasi, penting untuk mempertimbangkan konteks dan karakteristik kumpulan data ketika memilih algoritma klasifikasi yang tepat untuk aplikasi medis.

Downloads

Download data is not yet available.

References

Adirinarso, D. (2023). Klasifikasi Penyakit Kanker Payudara Berdasarkan Data Breast Cancer Winconsin dengan Menggunakan Metode Naive Bayes. In Nucl. Phys. (Vol. 13, Issue 1).

Cahyana, C. W., & Nurlayli, A. (2023). Analisis Performa Logistic Regression, Naïve Bayes, dan Random Forest sebagai Algoritma Pendeteksi Kanker Payudara. INSERT: Information System and Emerging Technology Journal, 4(1), 51–64.

Fauzi, A., Supriyadi, R., & Maulidah, N. (2020). Deteksi Penyakit Kanker Payudara dengan Seleksi Fitur berbasis Principal Component Analysis dan Random Forest. Jurnal Infortech, 2(1), 96–101. https://doi.org/10.31294/infortech.v2i1.8079

Hermawanti, L. (2012). Penerapan Algoritma Klasifikasi C4.5 untuk Diagnosis Penyakit Kanker Payudara. Jurnal Teknik Unisfat, 7(1), 57–64.

Mubarog, I., Setyanto, A., & Sismoro, H. (2019). Sistem Klasifikasi pada Penyakit Breast Cancer dengan Menggunakan Metode Naïve Bayes Classification System in Breast Cancer Using the Naïve Bayes Method. Citec Journal, 6(2), 109–118.

Munir, A. S., Saputra, A. B., Aziz, A., & Barata, M. A. (2024). Perbandingan Akurasi Algoritma Naive Bayes dan Algoritma Decision Tree dalam Pengklasifikasian Penyakit Kanker Payudara. Jurnal Ilmiah Informatika Global, 15(1), 23–29. https://doi.org/10.36982/jiig.v15i1.3578

Nugraheni, A., Ramadhani, R. D., Arifa, A. B., & Prasetiadi, A. (2022). Perbandingan Performa Antara Algoritma Naive Bayes Dan K-Nearest Neighbour Pada Klasifikasi Kanker Payudara. Journal of Dinda : Data Science, Information Technology, and Data Analytics, 2(1), 11–20. https://doi.org/10.20895/dinda.v2i1.391

Organization, W. H. (2024). Breast Cancer. World Health Organization. https://www.who.int/news-room/fact-sheets/detail/breast-cancer

Revoupedia. (2024). Random Forest. PT. Revolusi Cita Edukasi. https://revou.co/kosakata/random-forest

Rokom. (2022). Kanker Payudara Paling Banyak di Indonesia, Kemenkes Targetkan Pemerataan Layanan Kesehatan. Kemkes. https://sehatnegeriku.kemkes.go.id/baca/umum/20220202/1639254/kanker-payudaya-paling-banyak-di-indonesia-kemenkes-targetkan-pemerataan-layanan-kesehatan/

Safutra, A. R., & Prabowo, D. W. (2016). Diagnosis Penyakit Kanker Payudara Menggunakan Metode Naive Bayes Berbasis Desktop. Jurnal Penelitian Dosen FIKOM (UNDA), 6(1), 1–6.

Trivusi. (2022). Algoritma Random Forest: Pengertian dan Kegunaannya. Trivusi. https://www.trivusi.web.id/2022/08/algoritma-random-forest.html

Yulianti, I., Santoso, H., & Sutinigsih, D. (2016). Faktor-Faktor Risiko Kanker Payudara (Studi Kasus Pada Rumah Sakit Ken Saras Semarang). Jurnal Kesehatan Masyarakat Universitas Diponegoro, 4(4), 401–409. https://ejournal3.undip.ac.id/index.php/jkm/article/view/14162

Published

28-02-2025