Perbandingan Algoritma K-Means dan EM untuk Clusterisasi Nilai Mahasiswa Berdasarkan Asal Sekolah

Mardiani Mardiani

Abstract


Dari beberapa fungsionalitas data mining, digunakan clustering untuk mengelompokkan mahasiswa berdasarkan nilai. Cluster dilakukan dengan menggunakan algoritma yang sudah ada yaitu K-Means dan EM (Expectation Maximation). Setelah sebelumnya melakukan proses pembersihan data dengan menggunakan aplikasi SQL Server 2008, kemudian data dalam bentuk tabel diolah dengan aplikasi WEKA (Waikato Environment for Knowledge Analysis) untuk mendapatkan hasilnya. Hasil dari penelitian berupa clustering informasi sekolah mana yang berpotensi menghasilkan lulusan dengan nilai yang baik. Pengelompokan terdiri atas 3 cluster dengan kategori nilai tinggi, sedang dan rendah. Pengelompokan tersebut juga berdasarkan lokasi yang disebut sebagai spatial clustering. Kemudian dilakukan analisis hasil setelah mendapatkan data yang sudah terkelompok. Informasi yang didapat selanjutnya dapat dimanfaatkan untuk pengambilan keputusan di bidang pendidikan bagi mahasiswa dan manajemen STMIK MDP. Bagi pihak manajemen STMIK MDP informasi berguna untuk mengetahui sekolah mana yang memberikan kontribusi mahasiswa dengan nilai tertinggi.

From some of the functionality of data mining, clustering is used to group students based on the value. Clusters is done by using existing algorithms namely K-Means and EM (Expectation Maximation). Having previously done the cleaning process data using SQL Server 2008 applications, then the data in tabular form is processed by the WEKA (Waikato Environment for Knowledge Analysis) to get the result. Results from the study of clustering information which school has the potential to produce graduates with good grades. The grouping consists of three clusters with the category of high value, medium and low. Grouping is also referred to as a location based spatial clustering. Then performed the analysis of results after getting the data is already grouped. The information obtained can then be utilized for decision making in the field of education for students and management STMIK MDP. For the STMIK MDP management information useful to know which schools contribute to student with the highest score.


Full Text:

PDF

References


Agusta, Y., 2007, K-Means- Penerapan, Permasalahan dan Metode Terkait, Jurnal Sistem dan Informatika, vol 3, hal 47-60.

Ayub, M., 2007, Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer, Jurnal Sistem Informasi, vol 2, no 1, hal 21-30.

Budiarti, A., 2006, Aplikasi dan Analisis Clustering pada Data Akademik, Laporan Tugas Akhir, Fakultas Ilmu Komputer, Universitas Indonesia.

Han, J., Kamber, M., Tung, A. K. H., 2001, Spatial Clustering Methods in Data Mining: A Survey, School of Computing Science Simon Fraser University Burnaby, Canada.

Lidyawati, P., 2010, Analisis Spasial dengan Metode Density-Based Spatial Clustering of Application with Noise pada Basis Data Kriminal, Skripsi, Universitas Indonesia.

Sulianta, F., Juju, D., 2010, Data Mining: Meramalkan Bisnis Perusahaan, Elex Media Komputindo, Jakarta.

Susanto, S., Ernawati, 2007, Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy Clustering dan Partition Coefficient and Exponential Separation (PCAES) Index, Jurnal Teknologi Industri, Universitas Atmajaya, Yogyakarta.




DOI: https://doi.org/10.24076/citec.2014v1i4.31

Refbacks

  • There are currently no refbacks.


Indexed by:

 

Dedicated to:

 

Creative Information Technology Journal (CITEC Journal) is licensed under a Creative Commons Attribution 4.0 International License