The article addresses the issue of improvement of the results quality when Gene Ontology (GO) term similarity is calculated. Several GO similarity measures produce results out of the range [0; 1]. Whereas, in order to compare different similarity measures or apply further processing, it is needed to normalise the results to this range. The most popular and well-known method of normalization is the min-max normalization. The article introduces seven normalization functions of different characteristics that can improve the results of the analysis. The comparison of the analysed methods on three different gene datasets and their evaluation is presented in this paper.
PL
Artykuł porusza problem normalizacji podobieństwa wyznaczonego dla terminów ontologii Gene Ontology (GO). Wiele metod pozwalających wyznaczyć podobieństwo terminów GO daje wyniki spoza przedziału [0; 1], podczas gdy przedział ten jest wymagany w celu porównania wybranych metod oraz dalszych analiz. W niniejszej pracy zaprezentowano siedem różnych funkcji normalizacyjnych oraz ich porównanie w odniesieniu do metody normalizacji min-max. Badania zostały przeprowadzone na trzech zbiorach genów o różnej charakterystyce.
The article presents evaluation of the application of Neo4j graph database to Gene Ontology graph analysis. Graph-based term similarity measures are calculated in order to assess the effectiveness of the system. Two types of common ancestor search are presented and evaluated, and parallel execution of the analysis is also evaluated.
PL
Artykuł przedstawia ocenę zastosowania grafowej bazy danych Neo4j do analizy grafu ontologii Gene Ontology. Ocena systemu została przeprowadzona na podstawie obliczenia bazujących na analizie grafu miar podobieństwa terminów ontologii. Przedstawione i ocenione zostały dwa sposoby wyszukiwania rodziców w grafie. Analizie poddano również równoległą realizację badanych algorytmów.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.