PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA
DOI:
https://doi.org/10.12962/j24068535.v13i1.a386Abstract
Ringkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunakan fitur dari berita sendiri. Padahal dalam satu topik berita dimungkinkan adanya multiple issue. Dari multiple issue biasanya hanya ada satu isu yang menjadi pokok pembicaraan yang disebut dengan Trending Issue. Trending Issue inilah yang harusnya dipertimbangkan pada proses peringkasan berita sehingga ringkasan yang dihasilkan lebih koheren. Penelitian ini bertujuan untuk meringkas multi berita menggunakan metode pembobotan berdasarkan Trending Issue dengan tetap mempertimbangkan fitur penting berita, yaitu word frequency, TF-IDF, posisi kalimat, dan kemiripan kalimat terhadap judul (NeFTIS). Dimana Trending Issue didapatkan dari data Twitter dengan cara mengelompokkan tweets kemudian melakukan ekstraksi isu pada tiap kelompok yang terbentuk. Selanjutnya tiap isu diberikan bobot menggunakan konsep Cluster Importance (CI). Isu dengan bobot terbesar yang akan dipilih sebagai Trending Issue. Ada 5 tahap yang dilakukan untuk menghasilkan ringkasan multi berita dengan menggunakan NeFTIS, yaitu ekstraksi Trending Issue, seleksi berita, ekstraksi fitur berita, penghitungan total bobot kalimat, dan penyusunan ringkasan. Untuk mengukur kualitas sistem digunakan metode evaluasi ROUGE-1 dengan menganalisa performa dari hasil ringkasan dengan menggunakan metode pembobotan NeFTIS dibandingkan dengan hasil ringkasan dengan hanya menggunakan fitur berita (NeFS). Hasil rata-rata max-ROUGE-1 untuk seluruh variasi jumlah kalimat yang menyusun ringkasan (n) menunjukan bahwa metode pembobotan NeFTIS lebih akurat dibanding dengan metode pembobotan NeFS dengan nilai rata-rata max-ROUGE-1 terbesar 0.8201 untuk n=30.
Downloads
Downloads
Published
Issue
Section
How to Cite
License
All papers should be submitted electronically. All submitted manuscripts must be original work that is not under submission at another journal or under consideration for publication in another form, such as a monograph or chapter of a book. Authors of submitted papers are obligated not to submit their paper for publication elsewhere until an editorial decision is rendered on their submission. Further, authors of accepted papers are prohibited from publishing the results in other publications that appear before the paper is published in JUTI unless they receive approval for doing so from the Editor-in-Chief.
JUTI open access articles are distributed under a Creative Commons Attribution-ShareAlike 4.0 International License. This license lets the audience to give appropriate credit, provide a link to the license, and indicate if changes were made and if they remix, transform, or build upon the material, they must distribute contributions under the same license as the original.