PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!
  • Sesja wygasła!
  • Sesja wygasła!
Tytuł artykułu

Computer-supported process of proteomic data profiling

Identyfikatory
Warianty tytułu
PL
Wspomagany komputerowo proces profilowania danych proteomicznych
Języki publikacji
EN
Abstrakty
EN
The paper presents the complete and complex process of proteomic data profiling obtained in the process of mass spectrometry. The main described procedure is based on analyzing Gaussian Mixture Model representation of the data. However, the process of mass spectrometry data analysis is more complex and consists of a number of procedures, like data preparation, data pre-processing including baseline correction, detection of outliers and noise removal. The mean spectrum calculated based on received data is modeled with GMM and decomposed using the Expectation-Maximization algorithm. In this process localization of the mean spectrum peaks is found. Those results are applied into each single spectrum in the dataset in the form of Gaussian mask. The result in a set of data ready for further statistical analysis. This procedure enable to perform proteomic data profiling using specific statistical methods.
PL
Artykuł przedstawia kompletny, złożony proces profilowania danych proteomicznych uzyskanych w badaniach spektrometrycznych. Podstawowa opisana procedura analizy jest oparta o analizę modelu reprezentującego dane mieszanin gaussowskich. Jednak proces analizy danych spektrometrycznych jest bardziej złożony i składa się z wielu procedur, takich jak przygotowanie danych, wstępne przetwarzanie danych, detekcji danych odstających oraz usuwania szumu. Widmo średnie obliczone na podstawie otrzymanych danych jest modelowane w oparciu o model mieszanin gaussowskich dekomponowany za pomocą algorytmu maksymalizacji oczekiwanej wartości. W tym procesie wyszukiwane są pozycje pików z widma średniego. Otrzymane wyniki są nakładane na każde pojedyncze widmo w postaci maski gaussowskiej. Rezultatem jest zestaw danych gotowych do dalszej analizy statystycznej. Procedura ta pozwala wykonać profilowanie danych proteomicznych przy użyciu określonych metod statystycznych.
Czasopismo
Rocznik
Tom
Strony
8730--8739
Opis fizyczny
Bibliogr. 38 poz., rys., wykr., pełny tekst na CD3
Twórcy
  • Politechnika Lubelska, Instytut Informatyki, Wydział Elektrotechniki i Informatyki; 20-618 Lublin; ul. Nadbystrzycka 36
Bibliografia
  • 1. Baggerly K.A., Morris J., Wang J., Gold D., Xiao L.C., Coombes K.R., A comprehensive approach to the analysis of matrix-assisted laser desorp-tion/ionization time of flight proteomics spectra from serum samples. Prote-omics, s. 1667–1672, 2003.
  • 2. Boster B., Guyon I., Vapnik V., A training algorithm for optimal margin classifiers. Fifth Annual Workshop on Computational Learning Theory, s. 114– 152, 1992.
  • 3. Clyde M.A., House L.L., Wolpert R.L., Nonparametric models for proteomic peak identification and quatification. ISDS Discussion Paper, s. 2006–2007, 2006.
  • 4. Coombes K., Baggerly K., Morris J., Pre-processing mass spectrometry data, Fundamentals of Data Mining in Genomics and Proteomics, W Dubitzky, M Granzow, and D Berrar, eds. Kluwer, s. 79-99. 2007, Boston.
  • 5. Coombes K.R., Koomen J.M., Baggerly K.A., Morris J., Kobayashi R., Understanding the characteristics of mass spectrometry data through the use of simulation. Cancer Informatics, 1 s. 41–52, 2005.
  • 6. Comon P., Independent component analysis – a new concept? Signal Processing, 36 s. 287–314, 1994.
  • 7. Czerwinski D., Influence of the VM Manager on Private Cluster Data Mining System, Springer 2014, Communications in Computer and Information Science, Volume 431, 2014, pp 47-56.
  • 8. Fung E.T., Enderwick C., Proteinchip clinical proteomics: computational challenges and solutions. Biotechniques, Suppl., 32 s. 34–41, 2002.
  • 9. A.P. Dempster, N.M. Laird, and D.B. Rubin. Maximum likelihood from incomplete data via the EM algorithm. J. R. Stat. Soc., 39,1 s. 1-38, 1977.
  • 10. Du P., Kibbe W., Lin S., Improved peak detection in mass spectrum by incorporating continous wavelet transform-based pattern matching. Genome analysis, 22 s. 2059-2065, 2006.
  • 11. Dubitzky W., Granzow M., Berrar D., Fundamentals of data mining in genomics and proteomics. Springer, Kluwer Boston, 2007.
  • 12. Gentzel M., Kocher T., Ponnusamy S., Wilm M., Preprocessing of tandem mass spectrometric data to support automatic protein identyfication. Proteomics, 3, s. 1597–1610, 2003.
  • 13. Gutek D.: Model przetwarzania badań w pracowni radiologicznej powiązanej ze strukturą organizacyjną szpitala. Pomiary Automatyka Kontrola - 2012, nr 11, vol. 58, 959-961.
  • 14. Gras R., Muller M., Gasteiger E., Gay S., Binz P.A., Bienvenut W., Hoogland C.,. Sanchez J.C, Bairoch A., Hochstrasser D.F., Appel R.D., Improving protein identification from peptide mass fingerprinting through a parameterized multi-level scoring algorithm and an optimized peak detection. Electrophoresis, 20 s. 3535-3550, 1999.
  • 15. Gyaourova A., Kamath C., Fodor I.K., Undecimated wavelet transforms for image de-noising. Technical Report UCRL-ID-150931, Lawrence Livermore National Laboratory, Livermore, CA, 2002.
  • 16. Hubert, M., Van der Veeken, S. Outlier detection for skewed data, Journal of Chemometrics, 2008, 22, 235-246.
  • 17. Jutten C., H´erault J.: Blind separation of sources, part I, An adaptive algorithm based on neuromimetic architecture. Signal Processing, 24 s. 1-10, 1991.
  • 18. Kopniak P.: Pomiary kątów ugięcia kończyny w stawie z wykorzystaniem inercyjnego systemu Motion Capture, Pomiary Automatyka Kontrola 08/2014, str. 590-593, 2014
  • 19. Koziel G., Fourier transform based methods in sound steganography; Actual Problems of Economics No. 6(120) 2011; pp.321-328;ISSN 1993-6788
  • 20. Lang M., Guo H., Odegard J.E., Burrus C.S., Well R.O.Jr., Nonlinear processing of a shift invariant DWT for noise reduction. Proc. SPIE. Wavelet Applications II, 2491 s. 640-651, 1995.
  • 21. Lang M., Guo H., Odegard J.E., Burrus C.S., Well R.O.Jr., Noise reduction using an undecimated discrete wavelet transform. IEEE Signal Processing Let-ters, 3 s. 10-12, 1996.
  • 22. Lewandowicz A., Bakun M., Imiela J., Dadlez M., Proteomika w uronefrologii - nowe perspektywy diagnostyki nieinwazyjnej? Nefrologia i dializoterapia polska, 1 s. 15–21, 2009.
  • 23. Łukasik E., Pańczyk B., Sikora J.: Calculation of the improper integrals for Fourier boundary element method, Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska - 2013, nr 3, 7-10.
  • 24. Mantini D., Petrucci F., Pieragostino D., Del Boccio P., Di Nicola M., Di Ilio C., Federici G., Sacchetta P., Comani S., Urbani A., Limpic: a computational method for the separation of protein signals from noise. BMC Bioinformatics, 8:101, 2007.
  • 25. Mantini D., Petrucci F., Del Boccio P., Pieragostino D., Di Nicola M., Lugaresi A., Federici G., Sacchetta P., Di Ilio C., Urbani A., Independent component analysis for the extraction of reliable protein signal profiles from Maldi-ToF mass spectra. Bioinformatics, 24 s.63 – 70, 2008.
  • 26. Miłosz M. Performance testing of new enterprise applications using legacy load data : a HIS case study: ICEIS 2013 - 15th International Conference on Enterprise Information Systems - 2013, 269-274
  • 27. Morris J., Coombes K., Kooman J., Baggerly K., Kobayashi R.., Feature extraction and quantification for mass spectrometry data in biomedical applications using the mean spectrum. Bioinformatics, 21(9), 1764-1775. 2005.
  • 28. Polanska J., Plechawska M., Comparison of convergence criterions used in expectation-maximization algorithm. Symbiosis, 2008.
  • 29. Skublewska-Paszkowska M., Łukasik E., Smołka J.: Analysis of motion interpolation methods, Actual Problems of Economics -2012, nr 11, vol. 137, 448-455.
  • 30. Skublewska-Paszkowska, Smołka J.: Arms animation based on human hierarchical tree model, Przegląd Elektrotechniczny-2014, nr 2, vol. 90, p. 128-131
  • 31. Smołka, J., Skublewska-Paszkowska M., Comparison of interpolation methods based on real human motion data, Przegląd Elektrotechniczny.
  • 32. Tibshirani R., Hastiey T., Narasimhanz B., Soltys S., Shi G., Koong A., Le Q.T., Sample classification from protein mass spectrometry, by ’peak probability contrasts’. Bioinformatics, 20 s. 3034 – 3044, 2004.
  • 33. Tversky A., Hutchinson J.W., Nearest neighbor analysis of psychological spaces. Psychological review, 93(1) s. 3–22, 1993.
  • 34. Vapnik V.N., The Nature of Statistical Learning Theory. Springer, 1995.
  • 35. Vapnik V.N., Statistical Learning Theory. Wiley, 1998.
  • 36. Windham M.P. Cutler A., Information ratios for validating cluster analyses. Journal of the American Statistical Association, 87 s. 1188–1192, 1993.
  • 37. Wold H., Estimation of principal components and related models by iterative least squares. Multivariate Analysis, s. 391–420, 1966
  • 38. Yasui Y., Pepe M., Thompson M.L., Adam B.L., Wright G.L., Qu Y., Potter J.D., Winget M., Thornquist M., Feng Z., A data-analytic strategy for protein biomarker discovery: profiling of high-dimensional proteomic data for cancer detection. Biostatistic
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-274352bb-a3d1-4ed5-af86-c901ad5c922b
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.