Wyniki wyszukiwania - BazTech

Ograniczanie wyników

Znaleziono wyników: 2

Liczba wyników na stronie

Wyniki wyszukiwania

Wyszukiwano:
w słowach kluczowych: dopasowanie sekwencji

Sortuj według:

Ogranicz wyniki do:

Wyszukiwanie przybliżone sekwencji DNA z użyciem indeksu FM

Kawulok J.

Studia Informatica

2012

Vol. 33, nr 2A

493-506

Artykuł opisuje nowy algorytm wyszukiwania przybliżonego zadanych fragmentów DNA w długich sekwencjach. Zgodnie z zaproponowanym podejściem poszukiwany fragment jest dzielony na nakładające się słowa, których pozycje w badanej sekwencji są wyznaczane przez użycie indeksu FM. Wykorzystując tak otrzymaną listę pozycji słów w sekwencji, poszukuje się połączeń spełniających założenie o dopuszczalnej maksymalnej liczbie różnic. Stworzony algorytm został poddany walidacji eksperymentalnej, której wyniki przedstawiono w artykule.

This paper presents an algorithm for searching fragments of sequences in previously prepared DNA bases. The pattern is divided into words which overlap themselves. Their positions are found using FM-index, and they are used to search connections with each other under the assumption about a permissible maximum number of distinction.

Konstrukcja sekwencji konsensusowych rodziny białek β-spektryn o różnych parametrach progowych oraz weryfikacja ich użyteczności

Fogtman A., Leluk J., Lesyng B.

Bio-Algorithms and Med-Systems

2005

Vol. 1, no. 1/2

117--120

Rozwój zarówno sekwencyjnych, jak i strukturalnych białkowych baz danych umożliwił prowadzenie wielkoskalowych badań nad podobieństwem i homologią białek. Etapem kluczowym takich badań jest poprawna konstrukcja dopasowanego zestawienia sekwencji (z ang.: Multiple Alignment) oraz sekwencji konsensusowych. Sekwencja taka jest swoistym markerem danej rodziny białkowej; określa ona zestaw białek homologicznych specyficznie uwydatniających cechy charakterystyczne danej rodziny. Sekwencja konsensusowa jest uśrednieniem cech całej rodziny białkowej, umożliwiającym wnikliwą analizę mechanizmów ewolucji białek oraz stworzenie ich ogólnego schematu. Taka sekwencja może zostać użyta jako narzędzie do przeszukiwania baz danych pod względem podobieństwa i homologii białek wykazujących istotny stopnień identyczności. Prawidłowa konstrukcja sekwencji konsensusowych jest istotna dla uzyskania najbardziej optymalnych wyników analizy porównawczej białek. Konstrukcja takich sekwencji oparta jest na parametrach odpowiadających liczbie białek należących do danej rodziny, długości sekwencji oraz stopniu identyczności. W naszej pracy przeanalizowaliśmy ponad 50 sekwencji aminokwasowych β-spektryn. Dopasowanie tych sekwencji oraz zestaw optymalnych sekwencji konsensusowych dla β -spektryn skonstruowano z wykorzystaniem algorytmu semihomologii genetycznej oraz programu Consensus Constructor (ICM). Przeanalizowano wpływ różnych parametrów progowych na użyteczność skonstruowanych sekwencji konsensusowych. Sekwencje te wykorzystano do przeszukania sekwencyjnych baz danych, a wyniki przeszukiwania porównano pod względem ich użyteczności w badaniach porównawczych białek. Przedstawiona strategia konstrukcji sekwencji konsensusowych wydaje się być obiecującym, użytecznym narzędziem w precyzyjnym określaniu różnorodnych wspólnych cech homologicznych rodzin białkowych, nawet gdy obserwowany stopień podobieństwa/identyczności jest relatywnie niski. Praca wykonana została w ramach grantu MAMBA (Centre of Excellence for Multi-scale Biomolecular Modelling, Bioinformatics and Applications) Projekt nr QLRI-CT-2002-90383.

The development of the protein sequence and structure databases made wide scale similarity searches and homology analysis possible. The fundamental step in this research is a proper multiple alignment and consensus sequence construction. The consensus sequence is a specific marker describing the features of a given protein family. It enables the profound analysis of the evolutionary mechanisms and creation of their general structural scheme. It defines the set of homologous proteins, specifically emphasizing the distinctive features of a protein family. Such a sequence can be used as a tool to search databases for homologous proteins revealing the best actual similarity/homology score. Correct consensus sequence construction is key for obtaining the most optimum results of protein sequence homology research. The consensus sequence construction is based on parameters that apply to the number of members within a family, length of the protein sequences and the degree of identity. We analyzed over 50 sequences of β- spectrin family. The multiple alignment and the set of optimum consensus sequences for β-spectrin protein family were constructed with the aid of genetic semihomology algorithm and Consensus Constructor program (ICM). We examined the influence of variable threshold parameters on usefulness of the constructed consensus sequence. The consensus sequences of various threshold parameters were used to search the databases, and the scores were compared with respect to their usefulness in many criteria of comparative protein analysis. The strategy of consensus sequence construction appears to be powerful and accurate optimization tool for precise description of the significant common features of homologous protein families, even when the observed similarity/identity degree is relatively low. This work was supported by MAMBA (Centre of Excellence for Multi-scale Biomolecular Modelling, Bioinformatics and Applications) Project No. QLRI-CT-2002-90383.