Tytuł artykułu
Treść / Zawartość
Pełne teksty:
Identyfikatory
Warianty tytułu
Algorytm do analizy danych genetycznych – porównanie częstotliwości występowania określonych mutacji wśród różnych populacji
Języki publikacji
Abstrakty
This paper presents a novel algorithm which can be used to analyze genomic data obtained during Next Generation Sequencing (NGS). Due to the interest in the subject among geneticists, it is necessary to develop algorithms and programs which analyze genetic data that will be user-friendly and accessible to people not related to typical bioinformatics. A way of performing comparative analyze, including proper data preprocessing and final data processing is described. Input data for the algorithm are annotated .vcf files. The outcome of presented algorithm is a file with counted percentage of single nucleotide polymorphisms (SNP) in data for every loaded population.
W artykule przedstawiono nowatorski algorytm służący do analizy danych genomowych uzyskanych podczas sekwencjonowania nowej generacji (NGS). Ze względu na zainteresowanie tą tematyką wśród genetyków konieczne jest opracowanie przyjaznych dla użytkownika i dostępnych dla osób niezwiązanych z bioinformatyką algorytmów i programów analizujących dane genetyczne. Opisano sposób przeprowadzania analizy porównawczej, w tym wstępne i końcowe przetwarzanie danych. Dane wejściowe algorytmu to pliki formatu .vcf z adnotacjami. Wynikiem przedstawionego algorytmu jest plik zawierający informacje dotyczące częstości występowania polimorfizmów pojedynczego nukleotydu (ang. single nucleotide polymorphism, SNP) w badanych populacjach.
Słowa kluczowe
Rocznik
Tom
Strony
5--11
Opis fizyczny
Bibliogr. 9 poz., rys.
Twórcy
autor
- Faculty of Medicine, Nicolaus Copernicus University in Toruń, Ludwik Rydygier Collegium Medicum ul. Jagiellońska 13-15, 85-067 Bydgoszcz, Poland
- Faculty of Telecommunications, Computer Science and Electrical Engineering, UTP University of Science and Technology, Al. prof. S. Kaliskiego 7, 85-796 Bydgoszcz, Poland
autor
- Faculty of Telecommunications, Computer Science and Electrical Engineering, UTP University of Science and Technology, Al. prof. S. Kaliskiego 7, 85-796 Bydgoszcz, Poland
autor
- Faculty of Medicine, Nicolaus Copernicus University in Toruń, Ludwik Rydygier Collegium Medicum ul. Jagiellońska 13-15, 85-067 Bydgoszcz, Poland
Bibliografia
- [1] Abel H.J., Duncavage E.J., 2013. Detection of structural DNA variation from next generation sequencing data: a review of informatic approaches. Cancer Genet.
- [2] Afgan E., Baker D., Batut B., Van Den Beek M., Bouvier D., Čech M., et al., 2018. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2018 update. Nucleic Acids Res.
- [3] Akgün M., Demirci H., 2017. VCF-Explorer: filtering and analysing whole genome VCF files. Bioinformatics.
- [4] Andrews K.R., Luikart G., 2014. Recent novel approaches for population genomics data analysis. Wiley Online Library.
- [5] Auton A., Abecasis G.R., Altshuler D.M., Durbin R.M., Bentley D.R., Chakravarti A., et al., 2015. A global reference for human genetic variation. Nature.
- [6] Chiara M., Gioiosa S., Chillemi G., D’Antonio M., Flati T., Picardi E., et al., 2018. CoVaCS: a consensus variant calling system. BMC Genomics.
- [7] Danecek P., Auton A., Abecasis G., Albers C.A., Banks E., DePristo M.A., et al., 2011. The variant call format and VCFtools. Bioinformatics.
- [8] Di Resta C., Ferrari M., 2018. Next generation sequencing: from research area to clinical practice. Ejifcc.
- [9] Wang K., Li M., Hakonarson H., 2010. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-1c22c01f-1679-4212-bac2-5c36e427253b