Identyfikatory
Warianty tytułu
Rozszerzenie metod z rodziny TSP w klasyfikacji mikromacierzy DNA
Języki publikacji
Abstrakty
Klasyfikacja danych mikromacierzowych a także późniejsza interpretacja reguł decyzyjnych może być skutecznie przeprowadzona za pomocą metod z rodziny Top Scoring Pair, polegających na analizie par genow o przeciwstawych poziomach ekspresji w róźnych klasach. W poniższym artykule zaprezentowano nową metodę: Linked TSP, ktora rozszerza działanie klasyfikatorów k-TSP i Weight k-TSP. W przeciwieństwie do algorytmow z rodziny TSP proponowane rozwiązanie tworzy reguły decyzyjne zbudowane z pojedynczych genów, co znacznie ułatwia ich późniejszą interpretację medyczną. W algorytmie wykorzystywane są pary genow uzyskane z algorytmow TSP z których następnie, wybierane są pojedyncze, najczęściej powtarzające się geny. Testy algorytmu Linked TSP przeprowadzone zostająy na rzeczywistych zbiorach danych pacjentow a uzyskane wyniki są obiecujące.
Classification of microarray data and generation of simple and efficient decision rules may be successfully performed with Top Scoring Pair algorithms. TSP-family methods are based on pairwise comparisons of gene expression values. This paper presents a new method, referred as Linked TSP that extends previous approaches kˇTSP and Weight kˇTSP algorithms by linking top pairwise mRNA comparisons of gene expressions in different classes. Opposite to existing TSP-family classifiers, the proposed approach creates decision rules involving single genes that most frequently appeared in top scoring pairs. Motivation of this paper is to improve classification accuracy results and to extract simple, readily interpretable rules providing biological insight as to how classification is performed. Experimental validation was performed on several human microarray datasets and obtained results are promising.
Rocznik
Tom
Strony
31--45
Opis fizyczny
Bibliogr. 22 poz., Tab.
Twórcy
autor
autor
Bibliografia
- [1] Beer D.G.: Gene-expression Profiles Predict Survival of Patients with Lung Aenocarcinoma. Nature Medicine, 8(8):816-823, 2002.
- [2] BittnerM.,Meltzer P., Chen Y.:Molecular classification of cutaneous malignant melanoma by gene expression profiling. Nature, 406, 536-540, 2000.
- [3] Brown P.O., Botstein D.: Exploring the new world of the genome with DNA microarrays. Nature Genet 21. 33-37, 1999.
- [4] Cho H.S., Kim T.S., Wee J.W.: cDNA Microarray Data Based Classification of Cancers Using Neural Networks and Genetic Algorithms. Nanotech, vol. 1, 2003.
- [5] Czajkowski M., Kre¸towski M.: Novel extension of k-TSP algorithm for micro- array classification. Lecture Notes in Artificial Intelligence, vol. 5027:456-465, 2008.
- [6] Dhanasekaran S.M.: Delineation of prognostic biomarkers in prostate cancer. Nature, 412, 822-826, 2001.
- [7] Duggan D.J., Bittner M., Chen Y., Meltzer P., Trent J.M.: Expression profiling using cDNA microarrays. Nature Genetics Supplement, 21, 10-14, 1999.
- [8] Geman, D., d’Avignon, C., Naiman, D.Q.,Winslow, R.L.: Classifying Gene Expression Profiles from Pairwise mRNA Comparisons. Statistical Applications in Genetics and Molecular Biology, 3(1), 19, 2007.
- [9] Gordon J.G.: Translation of Microarray Data into Clinically Relevant Cancer Diagnostic Tests Using Gege Expression Ratios in Lung Cancer And Mesothelioma. Cancer Research, 62:4963-4967, 2002.
- [10] Grześ 1M., Kre¸towskiM.: Decision Tree Approach toMicroarray Data Analysis. Biocybernetics and Biomedical Engineering, vol. 27(3), 29-42, 2007.
- [11] Hastie T., Tibshirani R., Friedman J.H.: The Elements of Statistical Learning. Springer-Verlag, 2001.
- [12] Kent Ridge Bio-medical Dataset Repository: http://datam.i2r.astar.edu.sg/datasets/index.html
- [13] Kononenko I.: Estimating Attributes: Analysis and Extensions of RELIEF. In:European Conference on Machine Learning, 171-182, 1994.
- [14] Lockhart D.J.,Winzeler E.A.: Genomics, gene expression and DNA arrays. Nature 405, 827-836, 2000.
- [15] Lu Y., Han J.: Cancer classification using gene expression data. Information Systems, 28(4), pp. 243-268, 2003.
- [16] Nelson P.S.: Predicting prostate cancer behavior using transcript profiles. Journal of Urology, 172, 28-32, 2004.
- [17] Sebastiani P., Gussoni E., Kohane I.S., Ramoni M.F.: Statistical challenges in functional genomics. Statistical Science, 18(1), 33-70, 2003.
- [18] Simon R., Radmacher M.D., Dobbin K., McShane L.M.: Pitfalls in the use of DNA microarray data for diagnostic and prognostic classification. Journal of the National Cancer Institute, 95, 14-18, 2003.
- [19] Speed T.: Statistical Analysis of Gene Expression Microarray Data. Chapman & Hall/CRC, New York, 2003.
- [20] Tan A.C., Naiman D.Q., Xu L., Winslow R.L. and Geman D.: Simple decision rules for classifying human cancers from gene expression profiles. Bioinformatics, vol. 21, 3896-3904, 2005.
- [21] Vapnik, V.N.: Statistical Learning Theory. Wiley, New York, 1998.
- [22] Witten I.H., Frank E.: Data Mining: Practical machine learning tools and techniques. 2nd edn. Morgan Kaufmann, San Francisco, 2005.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPB2-0036-0008