Learning Vector Quantization untuk Klasifikasi Abstrak Tesis

Fajar Rohman Hariri, Ema Utami, Armadyah Amborowati

Abstract


Data berukuran besar yang sudah disimpan jarang digunakan secara optimal karena manusia seringkali tidak memiliki waktu dan kemampuan yang cukup untuk mengelolanya. Data bervolume besar seperti data teks, jauh melampaui kapasitas pengolahan manusia yang sangat terbatas. Kasus yang disoroti adalah data abstrak tugas akhir mahasiswa jurusan teknik informatika Universitas Trunojoyo Madura. Dokumen tugas akhir oleh mahasiswa terkait hanya diupload pada SIMTAK (Sistem Informasi Tugas Akhir) dan pelabelan bidang minat penelitian dilakukan manual oleh mahasiswa tersebut, sehingga akan ada kemungkian saat mahasiswa mengisi bidang minat tidak sesuai. Untuk menanggulangi hal tersebut, diperlukan adanya mekanisme pelabelan dokumen secara otomatis, untuk meminimalisir kesalahan. Pada penelitian kali ini dilakukan klasifikasi dokumen abstrak tugas akhir menggunakan metode Learning Vector Quantization (LVQ). Data abstrak diklasifikasikan menjadi 3 yaitu SI RPL (Sistem Informasi – Rekayasa Perangkat Lunak), CAI (Computation – Artificial Intelligence) dan Multimedia. Dari berbagai ujicoba yang dilakukan didapatkan hasil metode LVQ berhasil mengenali 90% data abstrak, dengan berhasil mengenali 100% bidang minat SI RPL dan CAI, dan hanya 70% untuk bidang minat Multimedia. Dengan kondisi terbaik didapatkan dengan parameter reduksi dimensi 20% dan nilai learning rate antara 0,1-0,5.

Huge size of data that have been saved are rarely used optimally because people often do not have enough time and ability to manage. Large volumes of data such as text data, exceed human processing capacity. The case highlighted was the final project abstract data from informatics engineering student Trunojoyo University. Documents abstract just uploaded on SIMTAK (Final Project Information System) and the labeling of the areas of interest of research is done manually by the student, so that there will be a possibility to fill the field of interest while the student is not appropriate. To overcome this, we need a mechanism for labeling a document automatically, to minimize errors. In the present study conducted abstract document classification using Learning Vector Quantization (LVQ). Abstract data classified into three class, SI RPL, CAI and Multimedia. Of the various tests carried out showed that LVQ method successfully recognize 90% of abstract data, to successfully identify 100% interest in the field of RPL SI and CAI, and only 70% for areas of interest Multimedia. With the best conditions obtained with the parameter dimension reduction of 20% and the value of learning rate between 0.1-0.5.


Full Text:

PDF

References


Sitanggang, I. S., Hermadi, I., Edward, 2007, Clustering Menggunakan Self-Organizing Maps (Studi Kasus: Data PPMB IPB), Jurnal Ilmiah Ilmu Komputer, Vol 5, No 2.

Toyota, T., Nobuhara, H., 2012, Visualization of the Internet News Based on Efficient Self-Organizing Map Using Restricted Region Search and Dimensionality Reduction, Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol 16, No 2, hal 219-226.

Turban, E., 2005, Decision Support System and Intelligent System, edisi Bahasa Indonesia Jilid I, Andi, Yogyakarta.

Andini, S., 2013, Klasifikasi Dokument Teks Menggunakan Algoritma Naive Bayes dengan Bahasa Pemograman Java, Jurnal Teknologi Informasi & Pendidikan, Vol 6, No 2, hal 140-147.

Jotheeswaran, J., Kumaraswamy, Y. S., 2013, Opinion Mining Using Decision Tree Based Feature Selection Through Manhattan Hierarchical Cluster Measure, Journal of Theoretical and Applied Information Technology, Vol 58, No 1, hal 72-80.

Hadnanto, M. A., 1996, Perbandingan Beberapa Metode Algoritma JST untuk Pengenalan Pola Gambar, Tugas Akhir, Teknik Elektronika, ITS Surabaya, Surabaya.

Agusta, L., 2009, Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia, Konferensi Nasional Sistem dan Informatika, Bali, 4 November 209.

Kusumadewi, S., 2003, Artificial Intelligence: Teknik & Aplikasinya, Graha Ilmu, Yogyakarta.

Yang, Y., Pedersen, J. O., 1997, A Comparative Study on Feature Selection in Text Categorization, Proceedings of the Fourteenth International Conference on Machine Learning (ICML'97), Nashville, Tennessee, USA, 8-12 Juli 1997.

Nazief, B. A. A., Adriani, M., 1996, Confix-Stripping: Approach to Stemming Algorithm for Bahasa Indonesia, Laporan Penelitian, Fakultas Ilmu Komputer, Universitas Indonesia.




DOI: https://doi.org/10.24076/citec.2015v2i2.43

Refbacks

  • There are currently no refbacks.


Indexed by:

 

Dedicated to:

 

Creative Information Technology Journal (CITEC Journal) is licensed under a Creative Commons Attribution 4.0 International License