RANCANG BANGUN APLIKASI PENCARIAN DOKUMEN BERBASIS WEB MENGGUNAKAN METODE SUFFIX CACTUS CLUSTERING
Abstract
Salah satu bagian dari temu kembali (retrieval) informasi adalah menyajikan data hasil pencarian dengan cara mengelompokkan (clustering) seluruh dokumen hasil pencarian sesuai dengan kemiripan antar dokumen. Agar tingkat kemiripan dokumen tinggi maka dokumen harus dibaca dengan memperhatikan struktur frasa-frasa penyusun dokumen (semantis).
Pembacaan secara semantis inilah yang kemudian membutuhkan representasi isi dokumen secara tepat. Hal ini dipecahkan dengan preprocessing dokumen hasil pencarian dalam bentuk struktur data suffix cactus. Implementasi struktur data suffix cactus memungkinkan pencarian string relatif lebih cepat dibandingkan query biasa. Suffix cactus bisa dikonstruksi dari suffix tree ataupun dari suffix array. Kinerja suffix cactus berada di antara keduanya.
Pada makalah ini, suffix cactus dikonstruksi berdasarkan pada informasi yang didapat dari suffix tree, sedangkan clustering diimplementasikan pada judul dokumen yang dianggap representasi dokumen berbahasa Indonesia. Hasil pencarian dokumen berupa grup-grup dokumen dan ditampilkan frasa-frasa baru yang memiliki kedekatan dengan keyword yang diinputkan. Pada makalah ini juga dilakukan pengukuran waktu eksekusi dan ukuran suffix cactus terhadap jumlah dokumen (hits).
Kata kunci: Information Retrieval, clustering, suffix tree, suffix cactus.
Full Text:
PDFDOI: http://dx.doi.org/10.12962/j24068535.v2i1.a109
Refbacks
- There are currently no refbacks.