RANCANG BANGUN APLIKASI PENCARIAN DOKUMEN BERBASIS WEB MENGGUNAKAN METODE SUFFIX CACTUS CLUSTERING
Abstract
Salah satu bagian dari temu kembali (retrieval) informasi adalah menyajikan data hasil pencarian dengan cara mengelompokkan (clustering) seluruh dokumen hasil pencarian sesuai dengan kemiripan antar dokumen. Agar tingkat kemiripan dokumen tinggi maka dokumen harus dibaca dengan memperhatikan struktur frasa-frasa penyusun dokumen (semantis).
Pembacaan secara semantis inilah yang kemudian membutuhkan representasi isi dokumen secara tepat. Hal ini dipecahkan dengan preprocessing dokumen hasil pencarian dalam bentuk struktur data suffix cactus. Implementasi struktur data suffix cactus memungkinkan pencarian string relatif lebih cepat dibandingkan query biasa. Suffix cactus bisa dikonstruksi dari suffix tree ataupun dari suffix array. Kinerja suffix cactus berada di antara keduanya.
Pada makalah ini, suffix cactus dikonstruksi berdasarkan pada informasi yang didapat dari suffix tree, sedangkan clustering diimplementasikan pada judul dokumen yang dianggap representasi dokumen berbahasa Indonesia. Hasil pencarian dokumen berupa grup-grup dokumen dan ditampilkan frasa-frasa baru yang memiliki kedekatan dengan keyword yang diinputkan. Pada makalah ini juga dilakukan pengukuran waktu eksekusi dan ukuran suffix cactus terhadap jumlah dokumen (hits).
Kata kunci: Information Retrieval, clustering, suffix tree, suffix cactus.
Downloads
Downloads
Published
Issue
Section
License
All papers should be submitted electronically. All submitted manuscripts must be original work that is not under submission at another journal or under consideration for publication in another form, such as a monograph or chapter of a book. Authors of submitted papers are obligated not to submit their paper for publication elsewhere until an editorial decision is rendered on their submission. Further, authors of accepted papers are prohibited from publishing the results in other publications that appear before the paper is published in JUTI unless they receive approval for doing so from the Editor-in-Chief.
JUTI open access articles are distributed under a Creative Commons Attribution-ShareAlike 4.0 International License. This license lets the audience to give appropriate credit, provide a link to the license, and indicate if changes were made and if they remix, transform, or build upon the material, they must distribute contributions under the same license as the original.











