Self Organizing Map-Neural Network untuk Pengelompokan Abstrak

Fajar Rohman Hariri, Danar Putra Pamungkas

Abstract


Data berukuran besar yang sudah disimpan jarang digunakan secara optimal karena kemampuan manusia yang terbatas untuk mengelolanya. Salah satu data berskala besar adalah data teks. Data teks memiliki fitur yang besar sehingga untuk mengolahnya memerlukan waktu komputasi yang besar pula. Proses clustering menggunakan metode Self Organizing Map dengan menerapkan reduksi dimensi pada tahap preprosesing. Metode ini diterapkan untuk mengelompokkan data tugas akhir mahasiswa Teknik Informatika Universitas Trunojoyo Madura. Dalam metode yang diusulkan, analisis morfologi dilakukan pada teks abstrak tugas akhir mahasiswa untuk menghasilkan vektor input dengan unsur term dari tugas akhir tersebut. Dari percobaan yang dilakukan, diperoleh hasil bahwa optimum cluster menghasilkan nilai rata-rata SSE = 0.01117.

Large data that is stored used rarely optimally because of the limited human ability to manage it. One of large-scale data is text data. Text data has enormous features so as to process it requires greater computational time. Clustering process using Self Organizing Map by applying dimensionality reduction on preprocessing. This method is applied to cluster the Informatics Engineering students' final assignment data of Trunojoyo University. In the proposed method, morphological analysis is applied on the abstract of final assignment to generate input vectors using elements of the final assignment. From the experiments conducted, the result that the best cluster to abstract data, average value of SSE = 0.01117.



Full Text:

PDF

References


Edward., 2007, Clustering Menggunakan Self-Organizing Maps (Studi Kasus: Data PPMB IPB), Skripsi, FMIPA, Institut Pertanian Bogor, Bogor.

Toyota, T., Nobuhara, H., 2012, Visualization of the Internet News Based on Efficient Self-Organizing Map Using Restricted Region Search and Dimensionality Reduction, JACIII, No. 2, Vol. 12, Hal 219-226.

Langgeni, D.P., Baizal, Z. K. A., Firdaus, Y., 2010, Clustering Artikel Berita Berbahasa Indonesia Menggunakan Unsupervised Feature Selection, Seminar Nasional Informatika 2010 (semnasIF), Yogyakarta, 22 Mei 2010.

Kusumadewi, S., 2004, Membangun Jaringan Syaraf Tiruan (menggunakan MATLAB & Excel Link), Penerbit Graha Ilmu, Yogyakarta.

Nazief, B., Adriani, M., 1996. Confix-Stripping: Approach to Stemming Algorithm for Bahasa Indonesia, Laporan Penelitian, Fakultas Ilmu Komputer, Universitas Indonesia.




DOI: https://doi.org/10.24076/citec.2016v3i2.74

Refbacks

  • There are currently no refbacks.


Indexed by:

 

Dedicated to:

 

Creative Information Technology Journal (CITEC Journal) is licensed under a Creative Commons Attribution 4.0 International License