Proteins interact to perform biological functions through specific interface residues. Correctly understanding the mechanisms of interface recognition and prediction are important for many aspects of life science studies. Here, we report a novel architecture to study protein interface residues. In our method, multiple dimensional space was built on some meaningful features. Then we divided the space and put all the surface residues into the regions according to their features’ values. Interestingly, interface residues were found to prefer some grids clustered together. We obtained excellent result on a public and verified data benchmark. Our approach not only opens up a new train of thought for interface residue prediction, but also will help to understand proteins interaction more deeply.
W dobie komputeryzacji i informatyzacji niemal każdej sfery naszego życia generowana jest coraz większa ilość danych. Ma to oczywiście swoje plusy, jak również minusy. Dysponując narastającą w ogromnym tempie ilością informacji, człowiek z natury nie ma możliwości przetworzenia danych w wiedzę, która za nimi stoi. Problem ten wymusza gwałtowny rozwój w ostatnich latach, jednej z kluczowych dyscyplin informatyki – eksploracji danych. Głównym celem niniejszej pracy było zebranie i analiza plików logu serwerowego oficjalnej strony Uniwersytetu Ekonomicznej w Katowicach oraz poznanie kontekstu zachowań użytkowników w wyniku segmentacji populacji. W tym celu konieczne było stworzenie projektu, którego celem praktycznym było odkrycie użytecznej wiedzy z udostępnionych logów serwerowych przy wykorzystaniu metody grupowania. W rezultacie pozwoliło to na przeprowadzenie analizy nawigacji użytkowników, ocenę ich zachowań, trendów i przyzwyczajeń.
EN
In the era of computerization, almost every sphere of our lives is generated by an increasing amount of data. Of course, it has its advantages as well as disadvantages. Due to the fact that the amount of information is growing really quickly, man is not naturally able to transform data into the knowledge behind them. This problem requires rapid development in recent years, one of the key areas of computer science - data mining. The main purpose of this research was to collect and analyze server log files from the official website of the University of Economics in Katowice. Then learning the context of user behavior as a result of segmentation of the population. For this purpose, it was necessary to create a project with the practical purpose of discovering useful knowledge from the server logs provided using the grouping method. As a result, users’ navigation was analyzed and their behavior, trends and habits were assessed.
We focused on applying parallel computing technique to the bulk loading of X-tree in other to improve the performance of DBSCAN clustering algorithm. We have given a full description of how the system can be archived. We proposed a new parallel algorithm for DBSCAN and another algorithm to extend the X-tree spatial indexing structure. Spatial database systems incorporate space in database systems, they support nontraditional data types and more complex queries, therefore in order to optimise such systems for efficient information processing and retrieval, appropriate techniques must be adopted to facilitate the construction of suitable index structures.
PL
W artykule autorzy skupiają swoją uwagę na zastosowaniu techniki przetwarzania równoległego przy wykorzystaniu struktur drzewiastych X-tree i algorytmu bulk loading. Zaproponowano nowy algorytm przetwarzania równoległego DBSCAN i drugi algorytm dla rozszerzania struktur indeksowania przestrzennego. Algorytm grupowania DBSCAN jest efektywnym algorytmem grupowania dla Systemów Przestrzennych Baz Danych, który ma możliwość wykrywania zakłóceń i nie wymaga znacznej liczby skupień wcześniej ustalonych, jednakże działanie algorytmu zmienia się, gdy rozmiar danych jest duży. Ten algorytm może nie działać optymalnie, jeśli niewłaściwe wartości są wybrane dla minpts i eps. Dlatego nowy zaproponowany algorytm powinien eliminować te ograniczenia.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.