Uji Pengaruh Karakteristik Dataset pada Performa Algoritma Klasifikasi

Authors

  • Moch Ali Mahmudi STMIK BINA PATRIA

DOI:

https://doi.org/10.25273/research.v1i1.2449

Abstract

Tujuan utama penelitian ini adalah untuk mengetahui pengaruh karakteristik set data pada performa algoritma klasifikasi. Pada penelitian ini digunakan tiga set data yang memiliki variasi tipe data, jumlah atribut, dan jumlah instan yang berbeda. Set data dibelajarkan pada algoritma klasifikasi, seperti SMO, Adaboost, CART, C4.5, dan Naïve Bayes. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan bahwa, tipe data, jumlah atribut, dan ukuran set data mempengaruhi performa algoritma klasifikasi. Semakin banyak jumlah atribut, kecenderungan akurasi kelima algoritma uji semakin tinggi. Algoritma klasifikasi yang terbaik digunakan pada tipe data numerik adalah C4.5, sedangkan untuk data nominal adalah SMO. Algoritma klasifikasi yang terbaik digunakan pada small dataset atau set data dengan jumlah instan kecil adalah Naïve Bayes dan SMO, sedangkan yang terbaik digunakan pada big dataset adalah SMO dan C4.5.

Downloads

Download data is not yet available.

References

Wahono, R.S. Data mining : Proses Data Mining. http://romisatriawahono.net. Diakses 9 Januari 2013

http://www.ics.uci.edu/~mlearn/MLRepository.html

http://www.sigkdd.org/kddcup/

Saini, D., Rajavat, A. 2013. Performance Evaluation System For Decision Tree Algorithms. Journal: International Journal Of Computers & Technology.

Fakhrurrifqi, M., Wardoyo R. 2013. Perbandingan Algoritma Nearest Network, C.45, dan LVQ untuk klasifikasi kemampuan mahasiswa. In IJCCS Universitas Gadjah Mada.

Abbas, O.A. 2008. Comparisons Beetwen Data Clustering Algorithm. The International Arab Journal of informastion Technology.

Tiwari, M., Jha, M.B., Yadav, O.P. 2012. Performance Analysis of Data mining Algorithm in weka.

Raiwal, J.S., Saxena, K. 2012. Performance Evaluation of SVM and K-Nearest Neighbor Algorithm over Medical Data set. International Journal of Computer Applications (0975 – 8887)

Wahyuni, E.S., Setiawan, N.A., Nugroho, H.A. 2013. Penerapan Metode Seleksi Fitur Pada Klasifikasi Kanker Payudara.

Subiyanto. A. 2008. Penggunaan Algoritma Klasifikasi Dalam Data Mining. Program Studi Sistem Informasi Fakultas Sains dan Teknologi UIN Jakarta

Downloads

Published

2018-04-13

How to Cite

Mahmudi, M. A. (2018). Uji Pengaruh Karakteristik Dataset pada Performa Algoritma Klasifikasi. RESEARCH : Journal of Computer, Information System & Technology Management, 1(1), 7–11. https://doi.org/10.25273/research.v1i1.2449

Issue

Section

Articles