PENGGALIAN INFORMASI MENGGUNAKAN MODEL TERDEKOMPOSISI: APLIKASI PADA RISET PENEMUAN ANTIBIOTIK
DOI:
https://doi.org/10.12962/j24068535.v16i1.a677Abstract
Penemuan obat-obatan antibiotik adalah salah satu tantangan pada bidang kemoinformatika. Dibutuhkan antibiotik baru secara cepat dan efektif karena banyak bakteri menjadi kebal terhadap antibiotik lama. Molekul-molekul kimia yang tersimpan di beberapa perusahaan dan laboratorium menyediakan kandidat yang berpotensi sebagai antibiotik baru. Tetapi, terlalu banyak kandidat yang harus diteliti. Untuk mengatasinya, dibutuhkan pencarian informasi yang dapat mendeteksi kandidat-kandidat penting melalui atribut mereka. Jumlah atribut tersebut sangatlah besar. Tujuan penelitian ini adalah mempelajari atribut-atribut tersebut dan menentukan atribut yang penting, dengan kata lain, untuk mereduksi dimensi data molekul. Fokus penelitian ini ditujukan pada molekul-molekul antibiotik yang sudah ada di pasaran, dengan sekitar 500 atribut yang diperoleh dari penelitian sebelumnya. Sebagai prosedur seleksi fitur, penelitian ini menggunakan analisis log-linear untuk menemukan asosiasi di antara atribut. Karena jumlah atribut mencapai ratusan, maka digunakan Chordalysis yang bekerja pada model log-linear yang bisa didekomposisi. Penelitian ini menemukan bahwa atribut-atribut dari penelitian sebelumnya memiliki beberapa asosiasi. Dengan demikian, beberapa atribut yang redundan dapat dieliminasi.
Downloads
References
P. Fernandes, “The global challenge of new classes of antibacterial agents: an industry perspective,” Current Opinion in Pharmacology, vol. 24, hal. 7–11, 2015.
U. Fayyad, G. Piatetsky-Shapiro, dan P. Smyth, “From Data Mining to Knowledge Discovery in Databases,” AI Magazine, vol. 17, no. 3, hal. 37–54, 1996.
Probabilistic Graphical Models, The MIT Press, Cambridge, 2009.
Using Multivariate Statistics, edisi kelima, Pearson Education Inc., Upper Saddle River, 2007, hal. 858–912.
The Analysis of Frequency Data, University of Chicago Press, Chicago, 1977.
A. Berry dan R. Pogorelnick, “A simple algorithm to generate the minimal separator and the maximal cliques of a chordal graph,” Infor-mation Processing Letters, vol. 111, no. 11, hal. 508–511, 2011.
F. Petitjean, G.I. Webb, dan A.E. Nicholson, “Scaling log-linear analysis to high-dimensional data,” IEEE 13th International Conference on Data Mining, hal. 597–606, 2013.
F. Malvestuto, “Approximating discrete probability distributions with decomposable models,” IEEE Trans. on Systems, Man, and Cyber-netics, vol. 21, no. 5, hal. 1287–1294, 1991.
F. Petitjean dan G.I. Webb, “Scaling log-linear analysis to datasets with thousands of variables,” dalam Proc. SDM15, Vancouver, Kanada, 2015, hal. 469–477.
P. Galinier, M. Habib, dan C. Paul, “Chordal graphs and their clique graphs,” Graph-Theoretic Concepts in Computer Science, Lecture Notes in Computer Science, hal. 358–371, 1995.
Molecular Description for Chemoinformatics, edisi kedua, Wiley-VCH, Weinheim, 2009.
J. Sadowski, J. Gasteiger, dan G. Klebe, “Comparison of Automatic Three-Dimensional Model Builders Using 639 X-ray Structures,” J. Chem. Inf. Comput. Sci., vol. 34, hal. 1000–1008, 1994.
J. Hung, “An experiment about the classification of antibacterial molecules”, Internal Technical Report, University of Lorraine, Nancy, 2015.
Downloads
Published
Issue
Section
How to Cite
License
All papers should be submitted electronically. All submitted manuscripts must be original work that is not under submission at another journal or under consideration for publication in another form, such as a monograph or chapter of a book. Authors of submitted papers are obligated not to submit their paper for publication elsewhere until an editorial decision is rendered on their submission. Further, authors of accepted papers are prohibited from publishing the results in other publications that appear before the paper is published in JUTI unless they receive approval for doing so from the Editor-in-Chief.
JUTI open access articles are distributed under a Creative Commons Attribution-ShareAlike 4.0 International License. This license lets the audience to give appropriate credit, provide a link to the license, and indicate if changes were made and if they remix, transform, or build upon the material, they must distribute contributions under the same license as the original.