Uji Performa Algoritma Naïve Bayes untuk Prediksi Masa Studi Mahasiswa

Irkham Widhi Saputro, Bety Wulan Sari

Abstract


Universitas AMIKOM Yogyakarta adalah salah satu perguruan tinggi yang memiliki ribuan mahasiswa baru khususnya pada prodi Informatika. Pada tahun 2012 tercatat ada 1009 mahasiswa baru, dan pada tahun 2013 juga tercatat ada sebanyak 859 mahasiswa baru. Namun sayangnya, dari sekian banyak mahasiswa hanya sekitar 50% saja yang dapat lulus dengan tepat waktu. Data tersebut untuk membuat sistem klasifikasi menggunakan teknik data mining dengan metode Naïve Bayes. Dataset yang akan digunakan sebanyak 300 data yang bersumber dari data alumni angkatan 2012, dan 2013 dengan masing-masing data sebanyak 150. Data yang diperoleh memiliki 144 mahasiswa dengan keterangan lulus tepat waktu, dan 156 mahasiswa dengan keterangan lulus tidak tepat waktu. Proses pengujian akan dilakukan menggunakan metode 10-Fold Cross Validation, dan Confusion Matrix. Hasil pengujian menunjukkan bahwa rata-rata performa dari model Naïve Bayes mempunyai nilai akurasi sebesar 68%, nilai precision sebesar 61.3%, nilai recall sebesar 65.3%, dan nilai f1-score sebesar 61%. Nilai performa dari model dapat dipengaruhi oleh dataset yang digunakan untuk pembuatan model.
Kata Kunci — data mining, Naïve Bayes, K-Fold Cross Validation, Confusion Matrix

AMIKOM Yogyakarta University is one of the colleges that has thousands of new students, especially in the Informatics study program. In 2012 there were 1009 new students, and in 2013 there were 859 new students. But unfortunately, of the many students only around 50% can graduate on time. The data is to make the classification system using data mining techniques with the Naïve Bayes method. The dataset will be used as much as 300 data sourced from alumni data of 2012, and 2013 with each data as much as 150. The data obtained has 144 students with information passed on time, and 156 students with graduation information not on time. The testing process will be carried out using the 10-Fold Cross Validation, and Confusion Matrix method. The test results show that the average performance of the Naïve Bayes model has an accuracy value of 68%, precision value is 61.3%, recall value is 65.3%, and f1-score is 61%. The performance value of the model can be influenced by the dataset used for modeling.
Keywords — data mining, classification, Naïve Bayes, graduation time


Full Text:

PDF

References


Jananto, A., 2013, Algoritma Naïve Bayes untuk Mencari Perkiraan Waktu Studi Mahasiswa, Jurnal Teknologi Informasi DINAMIK, No. 1, Vol. 18, Hal. 9 – 16.

Salmu, S., Solichin, A., 2017, Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta, Seminar Nasional Multidisiplin Ilmu 2017, Jakarta, 27 April.

Pratiwi, R. W., Nugroho, Y. S., 2016, Prediksi Rating Film Menggunakan Metode Naïve Bayes, Jurnal Teknik Elektro, No. 2, Vol. 8, Hal. 60 – 63.

Han, J., Kamber, M., Pei, J., 2012, Data Mining Concepts and Techniques 3rd Edition, Morgan Kauffman, San Fransisco.

Santosa, B., 2007, Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis, Graha Ilmu, Yogyakarta.

Hastie, T., Tibshirani, R., Friedman, J., 2009, The Elements of Statistical Learning Data Mining, Inference, Prediction 2nd Edition, Springer-Verlag, New York.




DOI: https://doi.org/10.24076/citec.2019v6i1.178

Refbacks

  • There are currently no refbacks.


Indexed by:

 

Dedicated to:

 

Creative Information Technology Journal (CITEC Journal) is licensed under a Creative Commons Attribution 4.0 International License