KOMPRESI MULTILEVEL PADA METAHEURISTIC FOCUSED WEB CRAWLER

Dian Septiani Santoso, R.V. Hari Ginardi

Abstract


Focused Web Crawler merupakan metode pencarian website yang sesuai dengan pencarian yang diinginkan oleh user. Untuk mendapatkan kecocokan yang baik, waktu yang dibutuhkan metode Focused Web Crawler lebih lama dibandingkan dengan metode pencarian web crawler pada umumnya yaitu algoritma Depth First Search (DFS) maupun Breadth First Search (BFS). Untuk mengatasi hal tersebut maka muncul sebuah ide yakni teknik pencarian Focused Web Crawler dengan menggunakan metode metaheuristic pencarian cuckoo yang dipadukan dengan pencarian pada data history pencarian yang disimpan. Namun dengan adanya penyimpanan data pada setiap kali pencarian link maka data akan semakin bertambah. Oleh karena itu diperlukan sebuah cara untuk mengurangi kebutuhan ruang penyimpanan. Cara yang dilakukan untuk mengurangi ruang penyimpanan dan tidak mengurangi nilai informasi dari data penyimpanan sebelumnya adalah dengan melakukan kompresi data. Dalam penelitian ini diusulkan metode kompresi data dengan melakukan kompresi multilevel menggunakan dua metode kompresi yaitu pengurangan prefix dan postfix kata dan kompresi string berbasis kamus dengan melakukan pembuatan indeks kamus kata. Hasil kompresi string kamus kata berupa data encode. Untuk menguji hasil dari kompresi data yaitu dengan melakukan perbandingan hasil pencarian link menggunakan metode Knutt Morris Pratt (KMP) dari data yang belum terkompresi dengan data yang telah terkompresi. Hasilnya didapatkan bahwa maksimum presisi dengan nilai 1 dan recall sebesar 0,73. Dari hasil percobaan metode, didapatkan bahwa rasio kompresi file rata-rata adalah sebesar 36,4%.


Full Text:

PDF

References


M. Kan, “Fast webpage classification using URL features,” dalam Proceedings of the 14th ACM international conference on Information and knowledge management, 2005, hal. 325–326.

S. K. Dwivedi dan C. Arya, “News web page classification using url content and structure attributes,” dalam Proceedings on 2016 2nd International Conference on Next Generation Computing Technologies, NGCT 2016, 2017, no. October, hal. 317–322.

G. Pant dan P. Srinivasan, “Link contexts in classifier-guided topical crawlers,” IEEE Trans. Knowl. Data Eng., vol. 18, no. 1, hal. 107–122, 2006.

B. W. Yohanes, Handoko, dan H. K. Wardana, “Focused Crawler Optimization Using Genetic Algorithm,” Telkomnika, vol. 9, no. 3, hal. 403–410, 2011.

B. Ganguly dan D. Raich, “Performance optimization of focused web crawling using content block segmentation,” dalam Proceedings - International Conference on Electronic Systems, Signal Processing, and Computing Technologies, ICESC 2014, 2014, hal. 365–370.

J. Dewanjee, “Heuristic Approach for Designing a Focused Web Crawler using Cuckoo Search,” dalam Int. J. Comput. Sci. Eng., vol. 04, no. 09, hal. 59–63, 2016.

I. Avraam, “A Comparison over Focused Web Crawling Strategies,” dalam Panhellenic Conference on Informatics, 2011, hal. 245–249.

Wikipedia, “Heuristik,” 2018.

G. E. S. S, “Kecerdasan Buatan ( Metode Heuristic ),” tidak dipublikasikan.

P. C. Local, P. Hybridization, A. C. See, dan R. Further, “Metaheuristic,” 2018.

X. Yang, S. Deb, dan A. C. B. Behaviour, “Cuckoo Search via L ´ evy Flights,” dalam 2009 World Congress on Nature & Biologically Inspired Computing (NaBIC), 2009, pp. 210–214.

X. Yang, S. Deb, N. World, dan M. A. Random, “Cuckoo search,” 2018.

D. Salomon, "Introduction ," dalam Data compression, edisi ke-3, New York, United States of America, 2004, bab I, hal. 1-14.

D. a Lelewer dan D. S. Hirschberg, “Data Compression,” ACM Comput. Surv., vol. 19, no. 3, pp. 261–296, 2004.

M. M. Kodabagi, “Multilevel Security and Compression of Text Data using Bit Stuffing and Huffman Coding,” dalam 2015 International Conference on Applied and Theoretical Computing and Communication Technology (iCATccT), 2015, hal. 800–804.

K. Kalajdzic, S. H. Ali, dan A. Patel, “Rapid lossless compression of short text messages,” Comput. Stand. Interfaces, vol. 37, no. JUNE, hal. 53–59, 2015.

A. Mahmood dan K. M. A. Hasan, “An Efficient 6 Bit Encoding Scheme for Printable Characters by Table Look Up,” dalam International Conference on Electrical, Computer and Communication Engineering (ECCE), February 16-18, 2017, Cox’s Bazar, Bangladesh An, 2017, hal. 468–472.

S. Kanda, K. Morita, dan M. Fuketa, “Practical String Dictionary Compression Using String Dictionary Encoding,” dalam 2017 International Conference on Big Data Innovations and Applications (Innovate-Data), 2017, hal. 4–11.




DOI: http://dx.doi.org/10.12962/j24068535.v17i1.a785

Refbacks

  • There are currently no refbacks.


Free counters!
Creative Commons License
JUTI (Jurnal Ilmiah Teknologi Informasi) by Department of Informatics, ITS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. JUTI is accordance with CC BY-SA.