Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 2

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  ensemble feature selection
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
Antioxidant proteins have been discovered closely associated with disease control due to its capability to eradicate excess free radicals. The accurate identification of antioxidant proteins is on the upsurge owing to their therapeutic significance. However, observing the rapid increases of this toxic disease in the human body, several machine learning algorithms have been applied and performed inadequately to identify antioxidant proteins. Therefore, measuring the effectiveness of antioxidant proteins on the human body, a reliable intelligent model is indispensable for the researchers. In this study, primary protein sequences are formulated using evolutionary and sequence-based numerical descriptors. Whereas, evolutionary features are collected using a bigram Position-specific scoring matrix, besides, K-space amino acid pair (KSAAP) and dipeptide composition are utilized to extract sequential information. Furthermore, in order to reduce the computational time and to eradicate irreverent and noisy features, the Sequential forward selection and Support vector machine (SFS-SVM) based ensemble approach is applied to select optimal features. At last, several distinct nature classification learning methods are applied to choose a suitable operational engine for our model. After evaluating the empirical results, SVM using optimal features achieved an accuracy of 97.54%, 93.71% using the training and independent dataset, respectively. It was found that our proposed model outperformed and reported the highest performance than the existing computational models. It is expected that the developed model may be played a useful role in research academia as well as proteomics and drug development. The source code and all datasets are publicly available at https://github.com/salman-khan-mrd/Antioxident_proteins.
2
Content available remote Training set size in ensemble feature selection for clinical proteomics
PL
Spektrometria masowa typu SELDI-TOF została w ostatnich latach zastosowana do diagnostyki nowotworów. W tym celu wykorzystywane są próbki płynów ustrojowych, które poddawane są analizie proteomicznej z wykorzystaniem spektrometru masowego. W efekcie uzyskiwany jest wielowymiarowy opis pobranej próbki. Dla zbioru pacjentów z oraz bez nowotworu możliwe jest stworzenie metody diagnostycznej opartej na metodach uczenia maszynowego. W niniejszym artykule analizujemy efekt wielkości zbioru trenującego używanego do uczenia klasyfikatora rozróżniającego próbki krwi od pacjentów zdrowych i z obecnym nowotworem jajnika. Użyty klasyfikator bazuje na metodzie zespołowej typu boosting używającej reguły decyzyjnej Fishera. Klasyfikator ten został rozszerzony o metodę selekcji cech. W artykule wykazano, iż dla odpowiedniego typu mikromacierzy białkowej użytej w metodzie spektrometrycznej SELDI-TOF, zbiór treningowy zawierający ok. 30-40 próbek pozwala na stworzenie klasyfikatora wykazującego 95%-ową dokładność klasyfikacji. Zintegrowana z klasyfikatorem metoda selekcji cech pozwala na skuteczną klasyfikację przy użyciu tylko 2 cech z widma spektrometrycznego.
EN
The SELDI-TOF mass spectrometry has been recently shown to be useful in diagnosis of a range of cancer types. In the procedure, samples of body fluids are subject to proteomic analysis using mass spectrometry, resulting in highly dimensional fingerprints. The fingerprints gathered from a set of cancer and control patients allow for creation of a machine learning-based method for diagnosing cancer. In this paper, we analyse the effects of the number of examples in the training set used for constructing a classifier distinguishing blood samples from normal and ovarian cancer patients. We employ a version of our FLD boosting classifier, extended to include a feature selection algorithm within a single machine-learning framework. We show that when a particular type of protein chip is used in SELDI-TOF-MS analysis, the training set containing samples from only ca. 30-40 patients is suitable for creating a classifier exhibiting ca. 95% accuracy, sensitivity and specificity to ovarian cancer. The feature selection procedure incorporated into the classifier reduces to 2 the number of mass/charge values used for discrimination.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.