PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

A system for simulation of DNA coverage in shotgun sequencing processes

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
System dla symulacji pokrycia DNA w procesach sekwencjonowania typu shotgun
Języki publikacji
EN
Abstrakty
EN
A design of a computational environment for simulation and statistical analysis of shotgun DNA sequencing process is presented. The approach involves developing simulation procedures on the basis of the Lander-Waterman theory. The explored aspects concern numbers of gaps and contigs. Simulations allow drawing certain conclusions: the created model is very similar to the Lander-Waterman theory, simulations of k-mers maps by the Poisson process allows estimating statistics of contigs number.
PL
W artykule zawarte są informacje dotyczące statystycznej analizy metody sekwencjonowania typu „Shotgun”. Projekt zakładał stworzenie środowiska obliczeniowego oraz modelu matematycznego, który jak najdokładniej odzwierciedla proces sekwencjonowania metodą „Shotgun”, wykorzystując przy tym losowe powstawanie krótkich sekwencji nukleotydowych, tak zwanych read’ów, a co za tym idzie również losowe formowanie się contig’ów – w pełni odtworzonych odcinków sekwencji. Stworzony model dzielił sekwencję zasad na zadaną ilość read’ów o stałej długości którą następnie odtwarzał poprzez porównanie końca poprzedniego i początku kolejnego read’a, sprawdzając tym samym ile fragmentów zostaje w pełni złożonych w contig’i. Jako własności statystyczne metody można rozumieć wzory Landera-Watermana przewidujące ilość powstawania contig’ów, które biorą pod uwagę całkowitą ilość read’ów, długość read’ów oraz całą długość sekwencji wejściowej. Wartości uzyskane metodą Landera-Watermana oraz uzyskane za pomocą modelu przedstawiono w postaci wykresu zależności ilości powstających contig’ów do parametru ścieżki pokrycia. Dodatkowo pod względem statystycznym wykreślono histogramy przedstawiające częstość występowania zasad w danym miejscu stworzone w oparciu o model oraz wykreślono na wykresie zakres wyników dla ilości powstających contig’ów wyliczony jako maksima i minima dla wielu losowych prób i przedstawione jako zależność od ścieżki pokrycia.
Słowa kluczowe
Wydawca
Rocznik
Strony
376--377
Opis fizyczny
Bibliogr. 3 poz., wykr.
Twórcy
  • Silesian University of Technology, Akademicka Street 16, 44-100 Gliwice, Poland
autor
  • Silesian University of Technology, Akademicka Street 16, 44-100 Gliwice, Poland
Bibliografia
  • [1] Polański A., Kimmel M.: Bioinformatics, Statistics of the Genome Coverage, 243-252, 2007.
  • [2] Eric S. Lander, Michael S. Waterman: Genomic Mapping by Fingerprinting Random Clones: A Mathematical Analysis, Genomics 2, 231-239, 1988.
  • [3] Michael C. Wendl, Shiaw-Pyng Yang: Gap statistics for whole genome shotgun DNA sequencing projects, Bioinformatics, 1527- 1534, vol. 20, no. 10, 2004.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-2ece487d-ac08-4542-9391-7d74b31f6bc6
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.