PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

A model of genome length estimation based on k-mers detection

Identyfikatory
Warianty tytułu
PL
Oszacowanie długości genomu na podstawie detekcji fragmentów k-mer
Języki publikacji
EN
Abstrakty
EN
The genome length estimation at raw sequencing data level gives a practical knowledge about size of the DNA sequence at early stage of analysis. In our research, we created a model based on random sampling of k-mer (very short DNA fragments), that we used to predict genome size. Furthermore, we made the comparison of model results with empirical whole-genome sequencing data.
PL
Oszacowanie rozmiaru genomu na podstawie surowych danych pochodzących z sekwencjonowania dostarcza wiedzy na temat długości DNA na wczesnym etapie analizy. W naszej pracy stworzony został model szacujący długość genomu oparty na losowym doborze krótkich fragmentów DNA zwanych k-mer. Wyniki powstałe przy użyciu modelu zostały odniesione do danych pochodzących z eksperymentów sekwencjonowania całych genomów.
Czasopismo
Rocznik
Strony
5--16
Opis fizyczny
Bibliogr. 10 poz.
Twórcy
  • Silesian University of Technology, Institute of Informatics, ul. Akademicka 16, 44-100 Gliwice, Poland
autor
  • Silesian University of Technology, Institute of Informatics, ul. Akademicka 16, 44-100 Gliwice, Poland
Bibliografia
  • 1. Polański A., Kimmel M.: Bioinformatics. Springer, 2006, p. 243÷252.
  • 2. Li X., Waterman M. S.: Estimating the repeat structure and length of DNA sequence using l-tuples. Genomes Res., vol. 13, 2003, p. 1916÷1922.
  • 3. Lander E. S., Waterman M. S.: Genomic mapping by fingerprinting random clones: A mathematical analysis. Genomics, vol. 2, 1988, p. 231÷239.
  • 4. Koronacki J., Mielniczuk J.: Statystyka dla studentów kierunków technicznych i przyrodniczych. Wydawnictwo Naukowo-Techniczne, Warszawa 2006.
  • 5. Zhang J. et al.: The impact of next-generation sequencing on genomics. J Genet Genomics, vol. 38(3), 2011, p. 95÷109.
  • 6. Schneeberger K., Weigel D.: Fast forward genetics enabled by new sequencing technologies. Trends in Plant Science, vol. 16, 2011.
  • 7. Liu L. et al.: Comparison of Next-Generation sequencing systems. Journal of Biomedicine and Biotechnology, vol. 2012, 2012.
  • 8. Schokralla et al.: Next-generation sequencing technologies for environmental DNA research. Molecular Ecology, 2012, p. 1794÷1805.
  • 9. Samella L.: Correction of sequencing errors in a mixed set of reads. Bioinformatics, vol. 26, 2010, p. 1284÷1290.
  • 10. Cock P. J. A.: The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variant. Nucleic Acids Research, vol. 38, 2010, p. 1767÷1771.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ec2f31f2-46bd-4360-81ef-daa8bcc3c009
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.