CLUSTERING DATA NON-NUMERIK DENGAN PENDEKATAN ALGORITMA K-MEANS DAN HAMMING DISTANCE STUDI KASUS BIRO JODOH
DOI:
https://doi.org/10.12962/j24068535.v4i1.a245Abstract
Clustering adalah salah satu metode populer yang telah digunakan di berbagai bidang penelitian mulai dari kecerdasan buatan, teknologi jaringan syaraf, pengenalan pola, hingga pengolahan gambar. Salah satu teknik yang digunakan dalam clustering adalah dengan menggunakan algoritma k-means. Namun sayangnya, algoritma k-means hanya bisa digunakan untuk dataset yang atributnya bernilai numerik. Padahal dalam kenyataannya, suatu database bisa terdiri atas data-data yang bernilai numerik maupun non-numerik. Dalam penelitian ini akan dibahas mengenai penggunaan algoritma k-means pada suatu clustering data non-numerik (categorical), dengan dibantu Hamming Distance sebagai alat untuk mengukur distance dari masing-masing atribut categorical-nya. Kasus yang diambil adalah pada dataset suatu biro jodoh yang mana akan menjadi menarik karena dengan clustering ini dapat diketahui bagaimana pola pembentukan grup-grup yang memiliki karakteristik hampir sama di dalam keanggotaan suatu biro jodoh. Pada penelitian ini juga akan diberikan implementasi penggunaan clustering dalam pencarian individu di suatu data biro jodoh.
Metodologi yang digunakan dalam penelitian ini meliputi beberapa tahapan. Tahapan pertama adalah persiapan data, yaitu data-data keanggotaan biro jodoh. Tahapan selanjutnya adalah proses modifikasi data dari non-numerik menjadi numerik. Kemudian tahap perhitungan distance antar-data. Lalu tahapan clustering pada data yang teleh bernilai jarak. Dan diakhiri dengan tahapan ringkasan dari hasil proses-proses tersebut.
Uji coba dan evaluasi dilakukan dengan menggunakan dataset nyata yaitu data biro jodoh Grasco, Sakinah Surabaya, Libe, dan O'Diva. Dari uji coba tersebut didapatkan bahwa clustering dapat dilakukan pada atribut-atribut categorical yang ditransformasikan terlebih dahulu ke dalam bentuk numerik. Selain itu, kesamaan (similarity) dan karakterisktik dari masing-masing keanggotaan biro jodoh bisa diketahui.
Kata Kunci : Data Mining, Clustering, Unsupervised Learning, K-Means.
Downloads
Downloads
Published
Issue
Section
How to Cite
License
All papers should be submitted electronically. All submitted manuscripts must be original work that is not under submission at another journal or under consideration for publication in another form, such as a monograph or chapter of a book. Authors of submitted papers are obligated not to submit their paper for publication elsewhere until an editorial decision is rendered on their submission. Further, authors of accepted papers are prohibited from publishing the results in other publications that appear before the paper is published in JUTI unless they receive approval for doing so from the Editor-in-Chief.
JUTI open access articles are distributed under a Creative Commons Attribution-ShareAlike 4.0 International License. This license lets the audience to give appropriate credit, provide a link to the license, and indicate if changes were made and if they remix, transform, or build upon the material, they must distribute contributions under the same license as the original.











