Tytuł artykułu
Treść / Zawartość
Pełne teksty:
Identyfikatory
Warianty tytułu
Przewidywanie immunogenności u myszy przy użyciu klasyfikatora Random Forest
Języki publikacji
Abstrakty
Biomedical data are difficult to interpret due to their large amount. One of the solutions to cope with this problem is to use machine learning. Machine learning can be used to capture previously unnoticed dependencies. The authors performed random forest classifier with entropy and Gini index criteria on immunogenicity data. Input data consisted of 3 columns: epitope (8-11 amino acids long peptide), major histocompatibility complex (MHC) and immune response. Presented model can predict the immune response based on epitope-MHC complex. Achieved results had accuracy of 84% for entropy and 83% for Gini index. The results are not fully satisfying but are a fair start for more complexed experiments and could be used as an indicator for further research.
Dane biomedyczne są trudne do interpretacji ze względu na ich dużą ilość. Jednym z rozwiązań radzenia sobie z tym problemem jest wykorzystanie uczenia maszynowego. Techniki te umożliwiają wychwycenie wcześniej niezauważonych zależności. W artykule przedstawiono wykorzystanie klasyfikatora Random Forest z kryterium entropii i indeksem Gini na danych dotyczących immunogenności. Dane wejściowe składają się z 3 kolumn: epitop (peptyd o długości 8-11 aminokwasów), główny kompleks zgodności tkankowej (MHC) i odpowiedź immunologiczna. Zaprezentowany model przewiduje odpowiedź immunologiczną na podstawie kompleksu epitop-MHC. Uzyskane wyniki osiągnęły dokładność na poziomie 84% (entropia) i 83% (indeks Gini). Wyniki nie są w pełni satysfakcjonujące, ale stanowią dobry początek dla bardziej złożonych eksperymentów i wyznacznik do dalszych badań.
Rocznik
Tom
Strony
31--43
Opis fizyczny
Bibliogr. 13 poz., rys., tab.
Twórcy
autor
- Faculty of Medicine, Nicolaus Copernicus University in Toruń, Ludwik Rydygier Collegium Medicum ul. Jagiellońska 13-15, 85-067 Bydgoszcz Poland
- Faculty of Telecommunications, Computer Science and Electrical Engineering, UTP University of Science and Technology, Al. prof. S. Kaliskiego 7, 85-796 Bydgoszcz, Poland
autor
- Faculty of Telecommunications, Computer Science and Electrical Engineering, UTP University of Science and Technology, Al. prof. S. Kaliskiego 7, 85-796 Bydgoszcz, Poland
autor
- Faculty of Medicine, Nicolaus Copernicus University in Toruń, Ludwik Rydygier Collegium Medicum ul. Jagiellońska 13-15, 85-067 Bydgoszcz Poland
Bibliografia
- [1] Achan P., Warrier A.G., Chitturi B., 2011. Biological Data Handling Methods. In: Proceedings of the International Conference on Bioinformatics & Computational Biology (BIOCOMP).
- [2] Cheng F., Liang H., Butte A.J., Eng C., Nussinov R., 2019. Personal mutanomes meet modern oncology drug discovery and precision health. Pharmacol Rev.
- [3] Creighton T.E., 1993. Proteins: structures and molecular properties. Macmillan;
- [4] DeVette C.I., Andreatta M., Bardet W., Cate S.J., Jurtz V.I., Jackson K.W., et al., 2018. NetH2pan: A computational tool to guide MHC peptide prediction on murine tumors. Cancer Immunol Res.
- [5] Hosseinzadeh A., Edalatpanah S., 2017. Classification Techniques in Data Mining: Classical and Fuzzy Classifiers. In: Emerging Research on Applied Fuzzy Sets and Intuitionistic Fuzzy Matrices.
- [6] Kamiński B., Jakubczyk M., Szufel P., 2018. A framework for sensitivity analysis of decision trees. Cent Eur J Oper Res.
- [7] Kotsiantis S.B., 2013. Decision trees: a recent overview. Artif Intell Rev.
- [8] Luna J.M., Gennatas E.D., Ungar L.H., Eaton E., Diffenderfer E.S., Jensen S.T., et al., 2019. Building more accurate decision trees with the additive tree. Proc Natl Acad Sci.
- [9] Nussinov R., Jang H., Tsai C-J., Cheng F., 2019. Precision medicine and driver mutations: Computational methods, functional assays and conformational principles for interpreting cancer drivers. PLoS Comput Biol.
- [10] Painsky A., Rosset S., 2016. Cross-validated variable selection in tree-based methods improves predictive performance. IEEE Trans Pattern Anal Mach Intell.
- [11] Patel H.H., Prajapati P., 2018. Study and analysis of decision tree based classification algorithms. Int J Comput Sci Eng.
- [12] Topîrceanu A., Grosseck G., 2017. Decision tree learning used for the classification of student archetypes in online courses. Procedia Comput Sci.
- [13] Zeng X., Yuan S,. Li Y., Zou Q., 2014. Decision tree classification model for popularity forecast of Chinese colleges. J Appl Math.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-de2a69ff-0b4d-4351-b18c-7c210eea3df9