This paper presents the current stage of the development of EA-MOSGWA - a tool for identifying causal genes in Genome Wide Association Studies (GWAS). The main goal of GWAS is to identify chromosomal regions which are associated with a particular disease (e.g. diabetes, cancer) or with some quantitative trait (e.g height or blood pressure). To this end hundreds of thousands of Single Nucleotide Polymorphisms (SNP) are genotyped. One is then interested to identify as many SNPs as possible which are associated with the trait in question, while at the same lime minimizing the number of false detections. The software package MOSGWA allows to detect SNPs via variable selection using the criterion mBIC2, a modified version of the Schwarz Bayesian Information Criterion. MOSGWA tries to minimize mBIC2 using some stepwise selection methods, whereas EA-MOSGWA applies some advanced evolutionary algorithms to achieve the same goal. We present results from an extensive simulation study where we compare the performance of EA-MOSGWA when using different parameter settings. We also consider using a clustering procedure to relax the multiple testing correction in mBlC2. Finally we compare results from EA-MOSGWA with the original stepwise search from MOSGWA, and show that the newly proposed algorithm has good properties in terms of minimizing the mBIC2 criterion, as well as in minimizing the misclassification rate of detected SNPs.
PL
W artykule przedstawiony jest aktualny stan rozwoju programu EA-MOSGWA - narzędzia służącego do identyfikacji przyczynowych genów w badaniach asocjacyjnych całego genomu (ang. Genome Wide Association Studies, GWAS). Głównym celem tych badań jest określenie tych rejonów chromosomu, które są związane z występowaniem chorób genetycznych (np. cukrzyca, rak) lub wpływają na daną cechę (np. wysokość lub ciśnienie krwi). Sprowadzają się one do przebadania wielu tysięcy polimorfizmów pojedynczego nukleotydu (ang. Single Nucleotide Polymorphisme SNP) i powiązaniu ich (pojedynczych lub grupy SNPów) z przypadkami klinicznymi oraz możliwymi do zmierzenia cechami. Kluczową kwestią jest zidentyfikowanie jak największej liczby przyczynowych SNPów przy jednoczesnej minimalizacji fałszywych odkryć. Program MOSGWA umożliwia detekcje SNPów poprzez wybór zmiennych z użyciem kryterium mBIC2 - zmodyfikowanej wersji Bayesowskiego kryterium informacyjnego Schwarza. MOSGWA stara się zminimalizować mBIC2 przy pomocy metody selekcji Stepwise, podczas gdy EA-MOSGWA wykorzystuje w tym cclu zmodyfikowaną wersję algorytmu ewolucyjnego. W artykule prezentujemy wyniki szeroko zakrojonych badań symulacyjnych, w których możemy porównać wydajność EA-MOSGWA przy użyciu różnych ustawień parametrów. Również bierzemy pod uwagę klasteryzację SNPów, aby złagodzić korekcje wielokrotnego testowania w metodzie mBIC2. Przedstawiamy także porównanie wyników otrzymanych przez EA-MOSGWA z wynikami metody Stepsiwe używanej w programie MOSGWA, aby pokazać że proponowana metoda ma dobre właściwości minimalizacji kryterium mBIC2 oraz minimalizacji wskaźnika fałszywych detekcji.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.