Spektrometria masowa typu SELDI-TOF została w ostatnich latach zastosowana do diagnostyki nowotworów. W tym celu wykorzystywane są próbki płynów ustrojowych, które poddawane są analizie proteomicznej z wykorzystaniem spektrometru masowego. W efekcie uzyskiwany jest wielowymiarowy opis pobranej próbki. Dla zbioru pacjentów z oraz bez nowotworu możliwe jest stworzenie metody diagnostycznej opartej na metodach uczenia maszynowego. W niniejszym artykule analizujemy efekt wielkości zbioru trenującego używanego do uczenia klasyfikatora rozróżniającego próbki krwi od pacjentów zdrowych i z obecnym nowotworem jajnika. Użyty klasyfikator bazuje na metodzie zespołowej typu boosting używającej reguły decyzyjnej Fishera. Klasyfikator ten został rozszerzony o metodę selekcji cech. W artykule wykazano, iż dla odpowiedniego typu mikromacierzy białkowej użytej w metodzie spektrometrycznej SELDI-TOF, zbiór treningowy zawierający ok. 30-40 próbek pozwala na stworzenie klasyfikatora wykazującego 95%-ową dokładność klasyfikacji. Zintegrowana z klasyfikatorem metoda selekcji cech pozwala na skuteczną klasyfikację przy użyciu tylko 2 cech z widma spektrometrycznego.
EN
The SELDI-TOF mass spectrometry has been recently shown to be useful in diagnosis of a range of cancer types. In the procedure, samples of body fluids are subject to proteomic analysis using mass spectrometry, resulting in highly dimensional fingerprints. The fingerprints gathered from a set of cancer and control patients allow for creation of a machine learning-based method for diagnosing cancer. In this paper, we analyse the effects of the number of examples in the training set used for constructing a classifier distinguishing blood samples from normal and ovarian cancer patients. We employ a version of our FLD boosting classifier, extended to include a feature selection algorithm within a single machine-learning framework. We show that when a particular type of protein chip is used in SELDI-TOF-MS analysis, the training set containing samples from only ca. 30-40 patients is suitable for creating a classifier exhibiting ca. 95% accuracy, sensitivity and specificity to ovarian cancer. The feature selection procedure incorporated into the classifier reduces to 2 the number of mass/charge values used for discrimination.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Following the rapid growth of high-detailed information on genomes and proteomes, methods for deducing properties of living organisms at the system level are in need. One approach for capturing the global characteristics of biological entities is to model them as complex networks. Such networks can then be analysed with descriptors tailored to reveal their static and dynamic properties. With metabolic and protein-protein interaction networks of two bacteria as examples, we show here the methodology for carrying such an analysis using a set of informative descriptors.
PL
Wraz ze wzrostem ilości zgromadzonych informacji o genomie i proteomie, wzrasta zapotrzebowanie na metody pozwalające na wnioskowanie o cechach badanego organizmu na poziomie systemowym. Jedno z podejść do tego problemu ujmuje globalne cechy organizmu jako złożoną sieć. Może ona być następnie analizowana przy pomocy deskryptorów zaprojektowanych pod kątem uwypuklania statycznych oraz dynamicznych cech systemu. Bazując na przykładach dotyczących sieci metabolicznych oraz zbudowanych w oparciu o interakcje białek dla dwóch mikroorganizmów, w niniejszej pracy prezentujemy metodologię analizy opartej na deskryptorach sieci złożonych.
3
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Rozpoznawanie obrazów medycznych stanowi jedno z istotnych zastosowań technik informatycznych w medycynie. Przykładem problemu z tej dziedziny jest komputerowe wspomaganie wykrywania nowotworów piersi na zdjęciach rentgenowskich. W niniejszym artykule przedstawiamy rezultaty prac nad komputerowymi metodami wspomagania diagnozy nowotworów piersi. Prowadzone przez nas prace skupiają się na dwóch podejściach do wykrywania znaczników raka piersi w mammogramach. Pierwsze podejście opiera się na stworzeniu filtru wrażliwego na mikrozwapnienia, a następnie konstrukcji metody łączenia ich w skupiska niosące informację diagnostyczną. Następnie obraz poddawany jest wyostrzaniu z użyciem transformaty falkowej. Tak przetworzone zdjęcia zostały przeanalizowane przez czterech doświadczonych radiologów. Analiza wykazała użyteczność systemu dla pewnych typów piersi oraz rodzajów skupisk mikrozwapnień. Alternatywą dla zarysowanego wyżej sposobu analizy zdjęć rentgenowskich piersi jest zastosowanie metod uczenia maszynowego do detekcji mikrozwapnień lub zacienień. Celem tego typu algorytmów jest klasyfikacja regionów mammogramu pod kątem obecności markerów raka. W niniejszym artykule prezentujemy rezultaty analizy tego podejścia z wykorzystaniem dwóch metod klasyfikacji: AdaBoost oraz SVM. Najlepsze wyniki zostały uzyskane przez klasyfikator AdaBoost. Pozwala on na wykrywanie zacienień w mammogramach z czułością i specyficznością wynoszącą około 90%. Skuteczność metod uczenia maszynowego silnie zależy od cech użytych do reprezentacji danych wejściowych. Szczególnie istotne znaczenie ma tu redukcja liczby cech tak, by tylko te, które niosą najwięcej informacji, były używane w klasyfikacji. W niniejszym artykule przedstawiamy wyniki selekcji cech na potrzeby klasyfikacji regionów mammogramów przy użyciu nowatorskiego algorytmu klasteryzacji.
EN
Medical image analysis is one of the most important applications of computer science in medicine. Computer-aided support for breast cancer detection in mammograms is one of the examples of such an approach. In this paper, we present the results of our efforts aimed at creating algorithmic methods for supporting the breast cancer diagnosis. Our work focuses on two approaches to detection of cancer markers in breast images. In the first approach, we have created a dedicated filter, which accentuates the appearance of the microcalcifications. Then, we have constructed a method for partitioning the detected microcalcifications into clusters of diagnostic importance. Next, the images are subject to wavelet transform-based enhancing. Mammograms treated by such a system were analysed by four experienced radiologists. Their analysis showed that the system indeed improves the diagnosis of breast cancer. An alternative to the approach presented above is to use a group of machine learning methods to distinguish between abnormal lesions and normal tissue. In this paper we present the evaluation of two classifiers applied to this task, the AdaBoost and the SVM. The best results, achieved by the AdaBoost method, allow for recognition of masses in mammograms with sensitivity and specificity of ca. 90%. The success of the machine learning methods depends strongly on the features used for representing the input data. Particularly important is the reduction of the number of features, so that only the most informative ones are used in classification. In this paper we show results of features selection, for classification of mammogram regions, using a novel clustering algorithm.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.