KATEGORISASI DOKUMEN TEKS SECARA MULTI LABEL MENGGUNAKAN FUZZY C-MEANS DAN K-NEAREST NEIGHBORS PADA ARTIKEL BERBAHASA INDONESIA
Abstract
Permasalahan kategorisasi dokumen berperan penting dalam sistem temu kembali informasi. Kategorisasi dokumen teks yang telah ada biasanya hanya dapat melakukan klasifikasi dengan satu label saja untuk satu dokumen. Padahal dalam kenyataannya, sebuah artikel dapat memuat lebih dari satu kategorisehingga label dokumen yang diberikan dapat berjumlah lebih dari satu.Untuk itulah, penelitian ini mengusulkan sebuah metode baru untuk kategorisasi dokumen teks secara multi label dengan menggunakan fuzzy c-means dan knearest neighbors. Fuzzy c-means melakukan pengelompokan dokumen yang serupa terlebih dahulu sebelum proses pemberian label. Kemudian, penentuan label dokumen ditentukan oleh k-dokumen terdekat pada kelompok dokumen yang serupa. Uji coba dilakukan terhadap dokumen berita online sejumlah 175 dokumen yang terdiri atas tiga kategori label. Hasil uji coba menunjukkan bahwa metode yang diusulkan memberikan performa lebih baik dibanding metode lain. Hal ini ditunjukkandengan nilaiF1 sebesar 73,39% dan BEP sebesar 75,22%.
Downloads
Downloads
Published
Issue
Section
License
All papers should be submitted electronically. All submitted manuscripts must be original work that is not under submission at another journal or under consideration for publication in another form, such as a monograph or chapter of a book. Authors of submitted papers are obligated not to submit their paper for publication elsewhere until an editorial decision is rendered on their submission. Further, authors of accepted papers are prohibited from publishing the results in other publications that appear before the paper is published in JUTI unless they receive approval for doing so from the Editor-in-Chief.
JUTI open access articles are distributed under a Creative Commons Attribution-ShareAlike 4.0 International License. This license lets the audience to give appropriate credit, provide a link to the license, and indicate if changes were made and if they remix, transform, or build upon the material, they must distribute contributions under the same license as the original.











