Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 7

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  outliers detection
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
Purpose: Knowledge management belongs to the most important elements of organisational management, including manufacturing enterprises. Patent information plays an increasingly important role in this area. Identification of the main directions of invention activity may inspire new product and process ideas, and can help to improve existing solutions. The above is particularly important in the energy sector, which is currently struggling with increasing problems. In this context, solar energy is the subject of interest to inventive communities. The paper discusses patent applications related to solar energy, taking up the task of discovering the main tendencies of technological solutions in this area. Design/methodology/approach: In the work, a pilot study of the research aimed to indicate the directions of technological development in the field in Poland was undertaken. Shortened descriptions of selected patent documents from the Polish Patent Office (PPO) were the subject of the investigation. The descriptions were reduced to the form of a vector space model by using text mining tools. The exploration of such prepared data was done applying unsupervised text mining techniques. Hierarchical cluster analysis enabled the identification of groups of similar inventions. An algorithm to detect outliers within individual patent groups was also developed and applied. Findings: Five patent clusters were identified covering the following thematic areas: PV panel designs, PV panel component designs, the improvement of solar-heat conversion device performance, and solar collector designs. Six patent applications stood out thematically in four of the five clusters. Research limitations/implications: The research is limited to a selected number of patent documents form PPO. However, the presented method and research area are promising. It is planned to extend the analyses to a larger set of patent documents and solve the problem related to the language uniformity of patent applications along with merging data from various sources. In this aspect, a full patent description will be consider as well. Originality/value: In relation to solar energy issues, main patent areas and patent outliers that may be indicators of special interests of inventors were identified. In relation to methodology issues, new solutions within consecutive research steps were proposed.
EN
Recently, several attempts have been made to build social air quality monitoring systems. Systems of this kind are solutions in the creation of which it is necessary to solve many problems concerned with the collection and analysis of data. After all, such systems are complex, extensive and multidisciplinary IT solutions. Our work focuses on creating such a system which, in addition to being a distributed social system, additionally uses low-budget and available measuring devices. The system consists of the data acquisition subsystem, then the data collection and analysis subsystem, and the communication system with the end user. In this article, we focus on describing data acquisition subsystems and on one aspect related to data analysis, namely outliers prediction using recurrent neural networks in the form of their implementation as LSTM.
PL
W okresie kilku ostatnich kilku miesięcy podjęto działania budowy społecznościowych systemów monitorowania jakości powietrza. Systemy tego rodzaju są rozwiązaniami, przy tworzeniu których konieczne jest rozwiązanie różnorodnych problemów związanych z gromadzeniem i analizą danych. Systemy tego rodzaju to złożone, rozbudowane i multidyscyplinarne rozwiązania informatyczne. Opisywana praca koncentruje się na działaniach związanych z stworzeniem takiego systemu, który oprócz tego, że jest rozproszonym systemem społecznościowym, dodatkowo wykorzystuje niskobudżetowe i ogólnie dostępne urządzenia pomiarowe. System składa się z podsystemu gromadzenia danych, następnie podsystemu gromadzenia i analizy danych oraz systemu komunikacji z użytkownikiem końcowym. W tym artykule skupiamy się na opisie podsystemów akwizycji danych oraz na wybranym zagadnieniu związanym z analizą danych, a mianowicie przewidywaniu wartości odstających z wykorzystaniem rekurencyjnych sieci neuronowych w postaci ich implementacji jako sieci LSTM.
PL
W artykule omówiono metodę wektorów nośnych w bardzo ważnym aspekcie wykrywania wyjątków w dużych zbiorach danych. Wykrywanie wyjątków jest istotne przy procesach analizowania danych, gdzie mamy do czynienia z klasyfikacja, grupowaniem, wyznaczaniem reguł asocjacyjnych. Istnienie wyjątków w klasyfikowanych czy grupowanych danych wpływa na cały kontekst analizy. Może prowadzić do wyznaczenia błędnych reguł. Wyjątki muszą być zatem identyfikowane. W niniejszym artykule skupiono się na metodzie wektorów nośnych w celu wykrywania wyjątków. Badania zostały oparte na zbiorach z repozytorium UCI [17].
EN
Outlier detection in data covers a broad spectrum of science research. In this paper, the author proposes an approach to outlier detection based on support vector machine. In data, an outlier may be considered as a deviation which indicates the existence of outliers. The paper presents the results of tests which were conducted on the set of data from the repository [19].
4
Content available remote Outlier detection using the multiobjective genetic algorithm
EN
Since almost all datasets may be affected by the presence of anomalies which may skew the interpretation of data, outlier detection has become a crucial element of many datamining applications. Despite the fact that several methods of outlier detection have been proposed in the literature, there is still a need to look for new, more effective ones. This paper presents a new approach to outlier identification based on genetic algorithms. The study evaluates the performance and examines the features of several multiobjective genetic algorithms.
5
Content available remote Detekcja wyjątków sygnałów biomedycznych w systemach fuzji informacji
PL
W tradycyjnych systemach wspomagania decyzji, czy też systemach ekspertowych decyzja podejmowana jest na podstawie jednego typu informacji, najczęściej zgromadzonej przez eksperta w jednej bazie wiedzy. Silne rozproszenie danych powoduje potrzebę wykorzystania informacji z wielu różnych źródeł i dopiero wówczas wyznaczania określonej (globalnej) decyzji. Autorzy omówili problem detekcji wyjątków, wybrane metody ich wykrywania oraz wykazano znaczenie odpowiedniego doboru miary odległości w przypadku algorytmów hierarchicznych. W niniejszym opracowaniu omówiono zaś problem fuzji informacji skupiając się na modelach i architekturze systemów fuzji. Zaproponowano algorytm globalnej detekcji wyjątków w systemach fuzji danych. Podano również wyniki badań dla zastosowanych algorytmów tj. k-najbliższy sąsiad oraz klasyfikatora Bayes’a.
EN
In traditional decision support systems or expert systems decision is taken on the basis of one type of information, mostly gathered by an expert in a knowledge base. A strong desire to spread the data makes use of information from many different sources and only then determine the specific (global) decision. The authors discussed the problem of outliers detection, the selected method of detection, and demonstrated the importance of appropriate selection of the distance measure for hierarchical algorithms. This paper discusses the problem of fusion data/information. We present models focusing on system architecture. Global detection algorithm is proposed exceptions in data fusion systems. Results are also given for the used algorithms such as k-nearest neighbor and the Bayes classifier.
PL
Metody wykrywania wyjątków w zbiorach danych dostrzegane jako różnego rodzaju anomalie, powstałe np. z powodu mechanicznego uszkodzenia, zmiany w zachowaniu systemu, czy choćby poprzez naturalny błąd człowieka, są stosowane już od wielu lat. Jak się jednak wydaje, powyżej sformułowany problem badawczy jest bardzo istotny i nadal aktualny. Wykrycie wyjątków stanowi podstawe w procesach podejmowania decyzji. W pracy podany jest krótki przegląd hierarchicznych aglomeracyjnych metod wykrywania wyjątków skupiając się na doborze miar odległości w wymienionych algorytmach.
EN
Data mining is a process of extracting valid, previous unknown, and ultimately comprehensible information for large datasets. One of very interesting problems appearing in scientific investigations are detection of mistakes in files of data, or the detection outlier. Finding the rare instance or the outliers is important in many disciplines and KDD (Knowledge Discovery and Data-Mining) applications. (Determination of measure distance in hierarchical methods of outliers detection).
7
Content available remote Finding outliers for large medical datasets
EN
The paper deals with data mining which is a process of extracting valid, previous unknown, and ultimately comprehensible information for large datasets. One of very interesting problems appearing in scientific investigations are detection of mistakes in files of data, or the detection outlier. Finding the rare instance or the outliers is important in many disciplines and KDD (Knowledge Discovery and Data-Mining) applications.
PL
Artykuł dotyczy metody wykrywania wyjątków w zbiorach danych dostrzegane jako różnego rodzaju anomalie, powstałe np. z powodu mechanicznego uszkodzenia, zmiany w zachowaniu systemu, czy choćby poprzez naturalny błąd człowieka. Jak się jednak wydaje, powyżej sformułowany problem badawczy jest bardzo istotny i nadal aktualny, szczególnie w przypadku medycznych zbiorów danych. Wykrycie wyjątków może zidentyfikować defekty, usunąć zanieczyszczenia danych a przede wszystkim stanowi podstawę w procesach podejmowania decyzji.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.