Klasifikasi Dokumen Teks Berbahasa Indonesia Menggunakan Minor Component Analysis
Klasifikasi Dokumen Teks Berbahasa Indonesia Menggunakan Minor Component Analysis
(Indra Juniawan – 2009)
Link : http://iirc.ipb.ac.id/jspui/handle/123456789/13007
Hasil Ulasan :
Karya ilmiah berjudul Klasifikasi Dokumen Teks Berbahasa Indonesia Menggunakan Minor Component Analysis” yang ditulis oleh Indra Juniawan ini bertujuan untuk mengimplementasikan dan menganalisis kinerja MCA dalam pengklasifikasian dokumen berita digital berbahasa Indonesia sehingga dapat membentuk model pengklasifikasian yang memiliki tingkat akurasi yang baik.
MCA adalah metode statistika yang digunakan untuk mengambil komponen-komponen minor dari sebuah data/dokumen.
Proses yang dilakukan dalam penelitian ini dimuali dari pengumpulan data, data contoh yang diambil sebanyak 750 dokumen yang bersumber dari Media Indonesia Online. Selanjutnya dilakukan proses Temu Kembali Informasi (proses parsing, pembuangan stop word, stemming, serta pembobotan dokumen menggunakan pembobotan tf.idf). Selanjutnya, data yang sudah terkumpul dibagi ke dalam 2 bagian, data latih dan data uji dengan proporsi data latih lebih besar dari data uji. Tahap selanjutnya yaitu melakukan proses pelatihan dengan menggunakan algoritme MCA. Hasil dari proses pelatihan kemudian diklasifikasikan berdasarkan beberapa kategori. Data hasil klasifikasi kemudian diuji tingkat akurasinya. Hasil dari proses secara keseluruhan adalah dokumen uji dapat diklasifikasikan ke dalam kategori tertentu.
Dalam penelitian ini, penulis menggunakan algoritme MCA untuk memperoleh satu komponen minor dari dokumen, hasil tingak akurasi dapat berbeda jika kita mengambil lebih dari satu komponen minor. Dan perlu dilakukan perbandingan tingkat efektifitas dengan algoritme klasifikasi lainnya sehingga dapat membantu dalam pemilihan metode klasifikasi yang baik.
No trackbacks yet.