PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Metoda hierarchiczna optymalnej selekcji genów do rozpoznania nowotworów na podstawie macierzy ekspresji genów

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
EN
Hierarchical approach to the optimal gene selection for cancer recognition on the basis of microarray gene expression data
Języki publikacji
EN
Abstrakty
EN
The paper proposes the hierarchical approach to the selection of the optimal set of genes for cancer recognition on the basis of the gene expression microarray. In the first stage 8 different methods of gene selection are applied to the microarray of gene expression. They include the application of linear Support Vector Machine, the Fisher discriminant ratio, the correlation analysis and statistical hypothesis tests (Kolmogorov-Smirnov, Wilcoxon-Mann-Whitney). On the basis of statistical results of each selection method 100 most discriminative genes (the genes most often appearing in the selected set) are selected first. Then in the second stage the genes selected by all methods are compared. Only the genes discriminated simultaneously by all selected methods are chosen. In this way small number of the genes associated with the appropriate cancer type is selected. The numerical experiments performed for different types of cancer (prostate, lung cancer, leukemia) have proved the efficiency of the proposed approach. The PCA distribution of data and the distance measures associated with PCA have shown that the selected genes discriminate different cancer types very well. Also the graphical representation of the considered data show significant improvement of the recognition ability of the selected genes.
PL
Praca przedstawia hierarchiczne podejście do selekcji genów odpowiedzialnych za choroby nowotworowe. Metoda składa się z dwu etapów. W pierwszym etapie zastosowano 8 różnych metod wartościowania genów według ich zdolności rozpoznawczej, w tym 2 metod opartych na liniowej sieci SVM, dyskryminancie Fishera, analizie korelacyjnej danych oraz zastosowaniu hipotez statystycznych, (3 odmiany metody Kołmogorowa-Smirnowa oraz test Wilcoxona). Na podstawie statystycznych wyników selekcji 100 najlepszych genów wyselekcjonowanych przy użyciu każdej metody w drugim etapie przetwarzania poszukuje się cech wspólnych, które traktuje się jako cechy optymalne, najlepiej różnicujące próbki danych należących do różnych klas nowotworowych. W pracy skoncentrowano się na wynikach eksperymentów numerycznych i ich analizie dla trzech przypadków nowotworów: białaczka, nowotwór prostaty i płuc. Pokazano, że zaproponowane podejście pozwala uzyskać dobre wyniki separacji różnych rodzajów nowotworów, widoczne zarówno na obrazie graficznym rozkładu macierzy ekspresji jak i w miarach numerycznych jakości separacji.
Rocznik
Strony
50--52
Opis fizyczny
Bibliogr. 11 poz., rys., tab.
Twórcy
autor
autor
Bibliografia
  • [1] Causton H. C., Quackenbush J., Brazma A., Microarray gene expression data analysis, Blackwell Publishing, 2003
  • [2] Duda R. O., Hart P. E., Stork D. G., Pattern classification and scene analysis, Wiley, N. Y., 2000
  • [3] Guyon I., Elisseeff A., An introduction to variable and feature selection, Journal of Machine Learning Research, 2003, vol. 3, pp. 1158 – 1182
  • [4] Guyon I., Weston J., Barnhill S., Vapnik V., Gene selection for cancer classification using SVM, Machine Learning, 2002, 46 pp. 389 – 422
  • [5] Huang T. M., Kecman V., Gene extraction for cancer diagnosis by SVM, Artif. Intell. In Med., 2005, 35, pp. 185 - 194
  • [6] Matlab user manual, MathWorks, 2005
  • [7] Osowski S., Sieci neuronowe do przetwarzania informacji, Oficyna Wydawnicza PW, 2006
  • [8] Schurmann J., Pattern classification, a unified view of statistical and neural approaches, Wiley, N. Y., 1996
  • [9] Speed T. P., Statistical analysis of gene expression microarray data, Chapman, London, 2003
  • [10] Wiliński A., Wybrane metody eksploracji cech diagnostycznych w analizie aktywności ekspresji genów, rozprawa doktorska Politechniki Warszawskiej, 2008
  • [11] Yusef M., Jung S., Showe L., Showe M., Recursive cluster elimination for classification and feature selection from gene expression data, Bioinformatics, 2007, 8:144, pp. 1-12
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOZ-0009-0007
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.