This paper presents a comparison between relational and graph database systems' performance in a web application recommendation system. The comparison is conducted on five different queries starting with simple ones, leading up to more complex queries, that are performed in a typical web social application. The implementation is done in C# using .NET framework and the database systems used are SQL Server and Neo4J. To effectively test the performance of both graph and relational database systems, tests were performed on 4 data sets. The tests imply performing 5 different retrieval queries taken in order of difficulty both in SQL and Neo4J.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
The paper concentrates on data models that differ from the traditional relational one by Codd (1970). In particular, we are interested in processing graph databases (graph datasets) without any pre-configured structure, in which graph nodes may represent different objects and graph edges - relations between them. In this approach, the linguistic summarization methods for graph datasets are introduced, and diferences for these methods with respect to traditional relational approach are shown, commented and improved in comparison to the preceding proposition (Strobin, Niewiadomski, 2016). The novelty of the paper is mostly the new form for summaries: Multi-Subject linguistic summaries of graph databases, previously introduced for relational databases (Superson, 2018).
Celem publikacji jest zaproponowanie i zaprezentowanie metodyki w pełni zautomatyzowanego tworzenia grafowego modelu topologicznego wybranych struktur katastralnych. Utworzono aplikację umożliwiającą zapis grafowych struktur katastralnych w bazie danych NoSQL. Poprzez zaproponowaną metodykę zaimplementowaną w prezentowanej aplikacji, przetworzono dane katastralne do nowych form, w których topologia ma istotne znaczenie. Jest zapisana w bazie grafowej, a jak wiadomo grafy są wizualizacją topologii. Automatyczne generowanie grafowego modelu struktur katastralnych opiera się na relacjach topologicznych danych geometrycznych. W narzędziach GIS (Esri) topologia jest tworzona i wykorzystywana w procesach analitycznych, ale nie jest ujawniona użytkownikom. W proponowanej aplikacji dostęp do topologii danych katastralnych stwarza nowe możliwości prezentacji, na przykład sąsiedztwa. W aplikacji zaimplementowano algorytmy importu danych, procesu konstrukcji topologii i zapisu w grafowej bazie danych. Dodatkowo zastosowano formę eksportu przechowywanych danych do formatu odczytywanego przez większość aplikacji GIS (pliki typu Shapefile). Prezentowane wyniki zapisu w postaci grafowej, umożliwiają dostrzeżenie sąsiedztwa działek pod różnym kątem. Grafowy modelu struktur katastralnych pozwala na ujawnianie dobrych i złych praktyk katastralnych oraz może być wykorzystany w procesie scalania gruntów.
EN
The aim of this paper is to propose and present an automatic topographic modelling methodology for selected cadastral structures. An application has been created that enables to store graph cadastral data in a NoSQL database. The proposed structure created by the application allows cadastral data conversion into a graph, maintaining the neighbourhood topology. In other GIS tools (Esri) the topology is created and used in analytical processes, but it is not disclosed to users. The access to the topology of cadastral data creates new presentation possibilities, such as the neighbourhood. The discussed application uses algorithms for data importing, topology construction and recording in the graph database. Additionally, the algorithm which enables to export stored data to the format readable for most GIS applications (Shapefile files) was developed. The presented results of the graph recordings enable to see the neighbourhood of parcels from different perspectives. The graph model of cadastral structures allows to identify good and bad cadastral practices and can be used in land consolidation processes.
4
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Reklamy w pasie drogowym stanowią nieodłączny element współczesnej architektury miejskiej. W zależności od treści przekazu, sposobu umiejscowienia oraz rodzaju podświetlenia, mogą one w różnym stopniu przyczynić się do rozproszenia uwagi osoby kierującej pojazdem. Ze względu na brak jednolitych przepisów prawnych regulujących standardy budowy oraz umieszczania reklam w obrębie drogi, oszacowanie wpływu reklamy na komfort kierowcy jest skomplikowane. Jednym z zadań projektu ROADVERT jest budowa narzędzia informatycznego, za pomocą którego można byłoby przeprowadzić kompleksową analizę technicznych aspektów reklam. Artykuł przedstawia zagadnienia związane z wybranymi etapami procesu projektowania takiego narzędzia. Wyodrębniono kategorie parametrów reklamy, jak np. aspekty treściowe, parametry oświetleniowe, lokalizacja reklamy w pasie drogowym, aspekty prawne etc. Opracowano i przedstawiono propozycję klasyfikacji reklam ze względu na poszczególne kryteria. Sformułowano wymagania funkcjonalne oraz techniczne do systemu. Zaproponowano obiektowy informatyczny model systemu, strukturę bazy danych oraz podstawowe elementy interfejsu użytkownika.
EN
Roadside advertising is an integrated part of modern urban architecture. They can disturb the attention of the vehicle driver depending on the content, the location, and the type of backlighting. Estimating the advertising impact on driver comfort is complicated due to lack of uniform legislation regulating construction standards and principles of ad placement near the road. One of the tasks of the ROADVERT project is to build an IT tool for a comprehensive analysis of the advertising technical aspects. This paper presents issues related to the selected stages of the IT tool design process. The categories of advertising parameters have been separated, such as lighting parameters, location of the advertisement in the lane, legislation aspects, etc. A proposal for advertisements classification depends on different criteria was developed and presented. The functional and technical requirements for the system have been formulated. An object-oriented IT system model and graph database structure were proposed.
Kryminalistyka jest nauką, która zajmuje się zarówno wykrywaniem przestępstw, jak również przewidywaniem oraz zapobieganiem powstawaniu i rozwojowi przestępczości. Już w XIX wieku lokalizacja miejsca przestępstwa była jednym z najważniejszych zadań wykrywczych organów ścigania. Niespełna sto lat później zaczęto wykorzystywać systemy informacji geograficznej w celu szybszego rozpoznawania i wykrywania sprawców przestępstw, prognozowania ich przestępczych zachowań, jak również planowania efektywniejszej dyslokacji patroli policyjnych. W artykule autorzy dokonują przeglądu metod i możliwości wykorzystania narzędzi GIS w rozpoznawaniu, wykrywaniu, dowodzeniu i przeciwdziałaniu (profilaktyce i prewencji) zachowań przestępczych. Przedstawiają także potencjalne możliwości wykorzystania grafowych baz danych, na przykład dla potrzeb tworzenia wersji kryminalistycznej, profilowania kryminalnego czy też w analizie kryminalnej.
EN
Criminology is a science that deals not only with the detection of crimes, but also with prediction and prevention of their emergence and development. As early as in the 19th century location of a crime was one of the most important tasks of law enforcement investigations. Less than a hundred years later, GIS began to be used in order to faster recognise and detect offenders, predicting their criminal behaviour, as well as for planning efficient dislocation of police patrols. In the article, the authors review the methods and possibilities to use GIS for crime recognition, detection, command and prevention. They also show the potential use of graph databases, e.g. for the purpose of criminal profiling or in the crime analysis.
Istnieje zapotrzebowanie na rozwiązania aplikacyjne wykorzystujące narzędzia GIS i grafowe umożliwiające przetwarzanie danych przestrzennych w celach analitycznych. Celem publikacji jest zaproponowanie i zaprezentowanie metodyki wykorzystania tych narzędzi do reprezentacji sąsiedztwa działek ewidencyjnych w ujęciu grafowym. Utworzono własne algorytmy do przetwarzania topologicznych danych przestrzennych w struktury grafowe i zapisu ich w bazie danych NoSQL. Proponowane rozwiązanie wiąże się z integracją platformy ArcGIS z platformą grafową. Umożliwia to szersze wykorzystanie przyjętych algorytmów przez większą liczbę odbiorców. Budowana struktura topologiczna jest zapisana w formie grafu zwykłego, a przez integrację z platformą GIS węzły i krawędzie opisane są współrzędnymi związanymi z lokalizacją w przestrzeni. Prezentowane wyniki analizy są wstępne, opierają się na relacjach topologicznych przy minimalnej liczbie atrybutów. Pomimo to, uzyskane wyniki stwarzają możliwości manipulowania danymi.
EN
There is a need for application solutions using GIS and graph tools enabling processing of spatial data for analytical purposes. The aim of the publication is to propose and present the methodology to use these tools to represent the neighbourhood of cadastral parcels in terms of graphs. A study was conducted to create original algorithms to process the topological structure of spatial data in graphs and to store them in the NoSQL database. The proposed solution involves integration of the ArcGIS platform with the graph database platform. It enables the wider use of adopted algorithms by a broader audience. Designed topological structure is stored in the form of a plain graph, and through integration with the GIS platform, nodes and edges are described by coordinates associated with a spatial location. The results of the analysis are based on topological relations with the minimum number of attributes. However, they provide opportunities for data manipulation.
The paper describes an application of a graph database to the abstract planning in the Planics composition system for web services. Abstract planning is the first stage of the service composition process, and consists in matching types of the services and objects processed by them, with some additional constraints. The result is an abstract plan matching the user query. The presented solution prunes the ontologies for the abstract planners, greatly improving efficiency and providing better scalability. This is of particular importance in the domain of web service composition, because usually systems are expected to produce answers immediatly.
PL
Praca opisuje zastosowanie grafowej bazy danych do fazy planowania abstrakcyjnego w systemie automatycznej kompozycji usług sieciowych Planics. Planowanie abstrakcyjne jest pierwszą fazą procesu planowania usług, i polega na dopasowaniu typów usług i przetwarzanych przez nie obiektów, w celu wygenerowania planu abstrakcyjnego spełniającego zapytanie skierowane do systemu przez użytkownika. Rozwiązanie bardzo istotnie zwiększa efektywność istniejących metod planowania opartych na testowaniu spełnialności formuł logicznych lub bazujących na algorytmach genetycznych. Jest to szczególnie ważne w dziedzinie planowania usług sieciowych, gdzie od systemów oczekuje się bardzo krótkich czasów przetwarzania zapytań. Metoda ogranicza przeszukiwaną ontologię ze względu na zapytanie użytkownika, znacząco ułatwiając znalezienie rozwiązań.
Artykuł przedstawia koncepcję wykorzystania współczesnej grafowej bazy danych do rozwiązania wybranego problemu logistycznego typu TSP. Sformułowano zadanie algorytmiczne „problemu komiwojażera”. Zaproponowano model danych opisujący problem z wykorzystaniem elementów struktury grafowej bazy danych. Zaimplementowano zapytania w języku grafowej bazy danych realizujące wybrane kroki algorytmu rozwiązania problemu. Oszacowano perspektywy zastosowania grafowej bazy danych do rozwiązania wybranego rodzaju problemów logistycznych.
EN
The paper presents the concept of using modern graph database, to solve the logistics problem of TSP type. The algorithmic task of "traveling salesman problem" was formulated. A data model that describes the problem using graph database structures was proposed. The graph-oriented queries performing selected steps of the algorithm to solve the problem are implemented. The perspectives of using graph database to solve the selected kind of logistic problems was estimated.
The article presents evaluation of the application of Neo4j graph database to Gene Ontology graph analysis. Graph-based term similarity measures are calculated in order to assess the effectiveness of the system. Two types of common ancestor search are presented and evaluated, and parallel execution of the analysis is also evaluated.
PL
Artykuł przedstawia ocenę zastosowania grafowej bazy danych Neo4j do analizy grafu ontologii Gene Ontology. Ocena systemu została przeprowadzona na podstawie obliczenia bazujących na analizie grafu miar podobieństwa terminów ontologii. Przedstawione i ocenione zostały dwa sposoby wyszukiwania rodziców w grafie. Analizie poddano również równoległą realizację badanych algorytmów.
10
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
This paper presents a novel method of evaluating semantic similarity by means of path analysis in RDF databases. Similarity is calculated by assignining each property (predicate in RDF terms) a weight, which is found using a genetic optimization algorithm. Presented method exhibits an advatage over existing methods, because of its flexibility and the fact that no prior knowledge of a particular database is necessary. This paper also presents an exemplary application of the method - recommendation engine. Proposed method is applied to a well known problem - music recommendation based on DBPedia. Results obtained in the experiment positively verify its advanntages and usefulness.
This article describes how Neo4j database capabilities can be utilized to implement measures often used in social network analysis. It gives a brief overview of the concept of Neo4j graph database. The UML class diagram of domain model is presented and discussed in details. On the basis of implementation of degree centrality and local clustering coefficient measures, several Neo4j core features are presented. In the summary, some general comments on using this database as a tool in a social network analysis are provided.
PL
Artykuł opisuje wykorzystanie możliwości bazy danych Neo4j w implementacji algorytmów stosowanych w analizie sieci społecznych. Przedstawiono w nim koncepcję Neo4j jako grafowej bazy danych oraz omówiono na diagramie klas podstawowe pojęcia z dziedziny przedmiotowej. Na podstawie implementacji dwóch miar (stopień węzła, lokalny współczynnik klasteryzacji), często używanych w analizie sieci społecznych, pokazano kilka podstawowych cech Neo4j. W ostatniej części znajduje się podsumowanie, w którym zebrano uwagi na temat wykorzystania tej bazy danych w analizie sieci społecznych.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.