PENGGALIAN INFORMASI MENGGUNAKAN MODEL TERDEKOMPOSISI: APLIKASI PADA RISET PENEMUAN ANTIBIOTIK

Nyoman Juniarta

Abstract

Penemuan obat-obatan antibiotik adalah salah satu tantangan pada bidang kemoinformatika. Dibutuhkan antibiotik baru secara cepat dan efektif karena banyak bakteri menjadi kebal terhadap antibiotik lama. Molekul-molekul kimia yang tersimpan di beberapa perusahaan dan laboratorium menyediakan kandidat yang berpotensi sebagai antibiotik baru. Tetapi, terlalu banyak kandidat yang harus diteliti. Untuk mengatasinya, dibutuhkan pencarian informasi yang dapat mendeteksi kandidat-kandidat penting melalui atribut mereka. Jumlah atribut tersebut sangatlah besar. Tujuan penelitian ini adalah mempelajari atribut-atribut tersebut dan menentukan atribut yang penting, dengan kata lain, untuk mereduksi dimensi data molekul. Fokus penelitian ini ditujukan pada molekul-molekul antibiotik yang sudah ada di pasaran, dengan sekitar 500 atribut yang diperoleh dari penelitian sebelumnya. Sebagai prosedur seleksi fitur, penelitian ini menggunakan analisis log-linear untuk menemukan asosiasi di antara atribut. Karena jumlah atribut mencapai ratusan, maka digunakan Chordalysis yang bekerja pada model log-linear yang bisa didekomposisi. Penelitian ini menemukan bahwa atribut-atribut dari penelitian sebelumnya memiliki beberapa asosiasi. Dengan demikian, beberapa atribut yang redundan dapat dieliminasi.

Full Text:

PDF

References

P. Fernandes, “The global challenge of new classes of antibacterial agents: an industry perspective,” Current Opinion in Pharmacology, vol. 24, hal. 7–11, 2015.

U. Fayyad, G. Piatetsky-Shapiro, dan P. Smyth, “From Data Mining to Knowledge Discovery in Databases,” AI Magazine, vol. 17, no. 3, hal. 37–54, 1996.

Probabilistic Graphical Models, The MIT Press, Cambridge, 2009.

Using Multivariate Statistics, edisi kelima, Pearson Education Inc., Upper Saddle River, 2007, hal. 858–912.

The Analysis of Frequency Data, University of Chicago Press, Chicago, 1977.

A. Berry dan R. Pogorelnick, “A simple algorithm to generate the minimal separator and the maximal cliques of a chordal graph,” Infor-mation Processing Letters, vol. 111, no. 11, hal. 508–511, 2011.

F. Petitjean, G.I. Webb, dan A.E. Nicholson, “Scaling log-linear analysis to high-dimensional data,” IEEE 13th International Conference on Data Mining, hal. 597–606, 2013.

F. Malvestuto, “Approximating discrete probability distributions with decomposable models,” IEEE Trans. on Systems, Man, and Cyber-netics, vol. 21, no. 5, hal. 1287–1294, 1991.

F. Petitjean dan G.I. Webb, “Scaling log-linear analysis to datasets with thousands of variables,” dalam Proc. SDM15, Vancouver, Kanada, 2015, hal. 469–477.

P. Galinier, M. Habib, dan C. Paul, “Chordal graphs and their clique graphs,” Graph-Theoretic Concepts in Computer Science, Lecture Notes in Computer Science, hal. 358–371, 1995.

Molecular Description for Chemoinformatics, edisi kedua, Wiley-VCH, Weinheim, 2009.

J. Sadowski, J. Gasteiger, dan G. Klebe, “Comparison of Automatic Three-Dimensional Model Builders Using 639 X-ray Structures,” J. Chem. Inf. Comput. Sci., vol. 34, hal. 1000–1008, 1994.

J. Hung, “An experiment about the classification of antibacterial molecules”, Internal Technical Report, University of Lorraine, Nancy, 2015.

DOI: http://dx.doi.org/10.12962/j24068535.v16i1.a677

Refbacks

There are currently no refbacks.

Username
Password
Remember me

Username
Password
Remember me