Artykuł przedstawia podejście do identyfikacji rodzaju szkła oparte na teorii zbiorów przybliżonych w programie RSES. Przedstawiono teoretyczne podstawy tej metody, opisano proces analizy danych oraz zaprezentowano wyniki identyfikacji rodzaju szkła.
The article presents an approach to glass type identification based on rough set theory in the RSES program. The theoretical basis of this method is presented, the data analysis process is described and the results of glass type identification are presented.
Knowledge of uncertainty in analytical results is of prime importance in assessments of compliance with requirements set out for the quality of water intended for human consumption. Assessments of drinking water quality can be per-formed using either a deterministic or a probabilistic method. In the former approach, every single result is referred directly to the parametric value, while in the probabilistic method uncertainty related to analytical results is taken into account during the decision-making process. In the present research, laboratory uncertainty and uncertainty deter-mined on the basis of results of analyses of duplicate samples collected in two Polish cities were compared and used in the probabilistic approach of water quality assessment. Using the probabilistic method, more results were considered to be “above the parametric value”. Most excesses were observed when the maximum allowable uncertainty as set out in the Regulation of the Minister of Health of 7 December 2017 was used, which is due to the highest values of these uncertainties. The lowest values above parametric values in the probabilistic approach were observed when measurement uncertainty was considered.
Artykuł stanowi kontynuację badań dotyczących zmodyfikowanego algorytmu dynamicznego programowania dla optymalizacji reguł decyzyjnych względem pokrycia. Praca przedstawia wyniki eksperymentalne dotyczące regułowego klasyfikatora, dla zbiorów danych umieszczonych w Repozytorium Uczenia Maszynowego.
The article is a continuation of research connected with a modified dy-namic programming algorithm for optimization of decision rules relative to coverage. The paper contains experimental results for rule based classifier using data sets from UCI Machine Learning Repository.
Celem artykułu jest wykorzystanie teorii zbiorów przybliżonych do indukcji reguł decyzyjnych warunkujących zastosowanie ekologicznej oceny cyklu życia w zidentyfikowanych modelach biznesowych MŚP. Wykorzystano w tym celu wyniki badania ankietowego przeprowadzonego w ramach projektu PARP „Wzorce zrównoważonej produkcji” oraz zdefiniowane typy modeli biznesu. W opracowaniu przedstawiono typologię modeli biznesu MŚP, dokonano klasyfikacji zmiennych na decyzyjne i warunkowe oraz wyznaczono reguły decyzyjne dla poszczególnych typów modeli, które prowadzą do zastosowania ekologicznej oceny cyklu życia.
The aim of the paper is to use Rough Set approach to induce decision rules on LCA use in selected business models of SMEs. For that purpose the results of “Sustainable production patterns” PARP survey are used together with defined business model types. The typology of SME business models are presented in the paper, and is used to classify companies to different business model types. It is followed by development of condition attributes and decision attribute sets and induction of decision rules for different business model types.
Omawiana jest nowa metoda indukcji reguł decyzyjnych, polegająca na dekompozycji, zbioru trenującego na podzbiory i poszukiwanie odpowiednio wówczas prostszych hipotez dla każdego z nich W rezultacie reguły decyzyjne mogą być generowane hierarchicznie, a proces indukcji reguł jest łatwiejszy gdyż operuje na tablicach decyzyjnych o mniejszych rozmiarach. Prostsze modele danych uzyskiwane w procesie dekompozycji zwiększają skuteczność indukcji oraz precyzję klasyfikacji nowych danych Istotną zaletą dekompozycji jest usprawnienie algorytmów stosowanych przy eksploracji rzeczywistych baz danych, co zostało potwierdzone eksperymentalna Dekompozycja stanowić może nowy sposób rozwiązywania problemów eksploracji danych wynikających z nadmiernej ich ilości i złożoności.
A new method for induction of decision rules is presented It is based on subsequent decomposition of the set of training data into subsets and searching for hypotheses for each of these subsets As a result, decision rules are being induced hierarchically, and - because of the reduced size of decision tables - this process is less computationally intensive Simpler data models obtained in the process of decomposition make it possible to increase the efficiency of rule induction and the accuracy of new data classification. Such an approach leads to a significant improvement of algorithms used for exploration of real databases, which has been verified through experimental studies. The decomposicion can, therefore, be seen as a new, efficient method for overcoming problems in exploration of databases, resulting from excessive volumes and high complexity of data.
Decision rules are commonly used tool for classification and knowledge discovery in data. The aim of this paper is to provide decision rule-based framework for analysis of survival data and apply it in mining of data describing patients after bone marrow transplantation. The paper presents a rule induction algorithm which uses sequential covering strategy and rule quality measures. An extended version of the algorithm gives the possibility of taking into account user’s requirements in the form of predefined rules and attributes which should be included in the final rule set. Additionally, in order to summarize the knowledge expressed by rule-based model, we propose the rule filtration algorithm which consists in selection of statistically significant rules describing the most disjoint parts of the entire data set. Selected rules are identified with so-called survival patterns. The survival patterns are rules which conclusions contain Kaplan-Meier estimates of survival function. In this way, the paper combines rule-based data classification and description with survival analysis. The efficiency of our method is illustrated with the analysis of data describing patients after bone marrow transplantation.
Artykuł zawiera zagadnienia dotyczące procesu podejmowania decyzji globalnych na podstawie wiedzy zgromadzonej w kilku lokalnych bazach wiedzy. Lokalne bazy wiedzy zawierają informacje dotyczące tej samej dziedziny, ale określone są na różnych zbiorach atrybutów warunkowych, które nie muszą być rozłączne. Artykuł zawiera opis wieloagentowego systemu decyzyjnego o strukturze hierarchicznej oraz propozycję metody eliminacji niespójności wiedzy, działającej na podstawie reguł decyzyjnych, wygenerowanych z użyciem lokalnych baz wiedzy. Głównym celem artykułu jest porównanie efektywności wnioskowania, uzyskanej przy zastosowaniu metody eliminacji niespójności wiedzy, działającej na podstawie reguł decyzyjnych z efektywnością wnioskowania, otrzymaną przy zastosowaniu znanych z literatury metod eliminacji niespójności wiedzy.
The paper includes issues related to process of global decision-making on the basis of knowledge which is stored in several local knowledge bases. The local knowledge bases, that are used, contain information on the same subject, but are defined on different sets of conditional attributes that are not necessarily disjoint. The paper contains a description of a multi-agent decision-making system with a hierarchical structure. In the paper a method of elimination inconsistencies in the knowledge operating on the basis of decision rules generated based on local knowledge bases was proposed. The main aim of this paper is to compare the efficiency of inference obtained using the method of elimination inconsistencies in the knowledge operating on the basis of decision rules, with the efficiency of inference obtained using the methods of elimination inconsistencies in the knowledge, which are known from the literature.
In the paper greedy algorithm for construction of β decision rules and algorithm for construction of β -complete systems of decision rules are studied. Obtined bounds on accuracy of the considered algorithms are presented.
W artykule został przedstawiony algorytm zachłanny dla konstruowania β -reguł decyzyjnych oraz dla konstruowania β -kompletnych systemów reguł decyzyjnych. Zostały zaprezentowane granice dokładności wyników uzyskiwanych za pomocą rozważanych algorytmów.
W niniejszej pracy dokonano syntezy modeli i algorytmów identyfikacji sytuacji przy ortogonalnej strukturze reguł decyzyjnych w symulacyjnym zarządzaniu potokami transportowymi na kolei. Sformułowano i udowodniono warunek konieczny i dostateczny identyfikacji sytuacji decyzyjnych. Podano przykład planowania kompleksowej regulacji wagonów.
The paper focuses on the synthesis of models and algorithms of identification of situations concerning the orthogonal structure of decision rules in simulation management of railway traffic streams. A necessary condition and a sufficient condition of identification of decision situations were formulated and proved. Moreover, an example of planning of a complex regulation of carriages was presented.
Content available remote Gry z naturą a niepełna informacja liniowa
W artykule rozważa się problematykę podejmowania decyzji w warunkach niepełnej informacji liniowej, co oznacza, że nie są dokładnie znane prawdopodobieństwa zaistnienia stanów natury, a jedynie pewne liniowe zależności, dotyczące tych prawdopodobieństw. Dla rozpatrywanej sytuacji proponuje się reguły wyboru decyzji optymalnych, oparte na dwukryterialnej ocenie wariantu decyzyjnego.
The article discusses decision making under conditions of linear partial information which means that probabilities of states of nature are not known precisely; linear constraints on probabilities are only known. Moreover, the paper presents rules of making optimal decisions concurrently based on expected payoffs and variances (standard deviations).
Artykuł dotyczy zastosowania teorii zbiorów przybliżonych w klasyfikacji stron internetowych. W pracy zaproponowano podejście integrujące elementy teorii zbiorów przybliżonych z bazami danych, którego celem jest zwiększenie wydajności oraz przetwarzanie danych bezpośrednio w miejscu ich przechowywania. Artykuł dotyczy implementacji w środowisku bazodanowym algorytmów selekcji atrybutów nieusuwalnych i reduktów względnych oraz wyznaczania reguł decyzyjnych. Celem jest klasyfikacja stron internetowych w oparciu o reguły decyzyjne oraz zbiór cech opisujących poszczególne dokumenty.
This paper concerns applying of rough sets theory to web pages classification. In this work the approach integrating elements of rough sets theory with databases was proposed, which the aim is improving of the efficiency as well as processing of data in the place of them store. The paper describes implementations of algorithms of core attributes and reducts selection as well as decision rules determining. The aim is web pages classifications on the basis of decision rules and the set of features describing individual web pages.
This article presents new rules, which can be used to construct a classifier for image areas segmentation. Segmentation is made on upon the colours, which are commonly associated with human skin colour. The new rules of this classifier have been developed on the basis of the analysis and modifications of two other classifiers, which has been described in the literature. Nowadays, such classifiers are commonly used in practice: in photographic equipment, photo-editing software, biological images analysis or in-room person detecting systems.
In this paper we present a method for evaluating the importance of GO terms which compose multi-attribute rules. The rules are generated for the purpose of biological interpretation of gene groups. Each multi-attribute rule is a combination of GO terms and, based on relationships among them, one can obtain a functional description of gene groups. We present a method which allows evaluating the influence of a given GO term on the quality of a rule and the quality of a whole set of rules. For each GO term, we compute how big its influence on the quality of generated set of rules and therefore the quality of the obtained description is. Based on the computed quality of GO terms, we propose a new algorithm of rule induction in order to obtain a more synthetic and more accurate description of gene groups than the description obtained by initially determined rules. The obtained GO terms ranking and newly obtained rules provide additional information about the biological function of genes that compose the analyzed group of genes.
Classification of microarray data and generation of simple and efficient decision rules may be successfully performed with Top Scoring Pair algorithms. TSP-family methods are based on pairwise comparisons of gene expression values. This paper presents a new method, referred as Linked TSP that extends previous approaches kˇTSP and Weight kˇTSP algorithms by linking top pairwise mRNA comparisons of gene expressions in different classes. Opposite to existing TSP-family classifiers, the proposed approach creates decision rules involving single genes that most frequently appeared in top scoring pairs. Motivation of this paper is to improve classification accuracy results and to extract simple, readily interpretable rules providing biological insight as to how classification is performed. Experimental validation was performed on several human microarray datasets and obtained results are promising.
Klasyfikacja danych mikromacierzowych a także późniejsza interpretacja reguł decyzyjnych może być skutecznie przeprowadzona za pomocą metod z rodziny Top Scoring Pair, polegających na analizie par genow o przeciwstawych poziomach ekspresji w róźnych klasach. W poniższym artykule zaprezentowano nową metodę: Linked TSP, ktora rozszerza działanie klasyfikatorów k-TSP i Weight k-TSP. W przeciwieństwie do algorytmow z rodziny TSP proponowane rozwiązanie tworzy reguły decyzyjne zbudowane z pojedynczych genów, co znacznie ułatwia ich późniejszą interpretację medyczną. W algorytmie wykorzystywane są pary genow uzyskane z algorytmow TSP z których następnie, wybierane są pojedyncze, najczęściej powtarzające się geny. Testy algorytmu Linked TSP przeprowadzone zostająy na rzeczywistych zbiorach danych pacjentow a uzyskane wyniki są obiecujące.
Classification of the tasks for real-world problems becomes possible because of creation and use of more efficient IT systems. It also targets rough set methods as well described with solid mathematical basis for classification tasks. In the presented paper the application of rough set theory with the usage of significance of attributes and decision rule sets for classification of taxpayers is described. There are taken into account the negative or positive results of taxation control, and specific features describing payers are considered. Appropriate choice of data, building the model and its application leads to the specified goal reaching, with better accuracy in comparison to "intuitive" choice. Simultaneously it becomes possible to extract decision rules in the linguistic form, what gives opportunity for easier interpretation of obtained results. As a result of the solution application the more accurate selection of tax payers is obtained. This is of significant meaning for the tax authorities, and this leads for the better observance of the tax law.
Rozwiązywanie zadań klasyfikacji dla rzeczywistych problemów stało się możliwe dzięki rozwojowi wydajniejszych systemów informatycznych. Dotyczy to również teorii zbiorów przybliżonych dla zadań klasyfikacji. W przedstawionej publikacji zastosowano zbiory przybliżone, które mają ugruntowaną teorię bazującą na rozszerzeniu teorii zbiorów i definiującą dolne oraz górne przybliżenie, oraz wyznaczającą tabelę decyzyjną do klasyfikacji. Metodę użyto do obliczeń istotności atrybutów oraz reguł decyzyjnych opisujących klasyfikację podatników ze względu na pozytywny lub negatywny wynik kontroli, przy uwzględnieniu specyficznych cech ich opisujących. Odpowiedni dobór danych, budowa modelu oraz jego użycie umożliwiło osiągnięcia zadanego celu ze zwiększoną dokładnością w stosunku do "intuicyjnego" wyboru. Wykorzystanie zbiorów przybliżonych, które wyznaczają wyniki końcowe klasyfikacji w postaci zbioru reguł umożliwiło ich ekstrakcję w łatwo interpretowalnej formie lingwistycznej. W publikacji zastosowano autorskie rozwiązanie programowe bazujące na kolekcjach, tablicach oraz obiektach pośrednich, zaimplementowane dla bazy danych Oracle, dzięki któremu zrealizowano zadanie oraz przedstawiono rezultaty. Dzięki uzyskanym wynikom bazującym na modelu opartym na użytej metodzie możliwe staje się dokładniejsze typowanie podatników funkcjonujących w polskim systemie prawnym i mających problemy podatkowe, których należy poddać kontroli. Tym samym zwiększa się skuteczność egzekwowania prawa podatkowego.
Content available remote Analysis of GO composition of gene clusters by using multiattribute decision rules
In this paper, a novel method for characterizing the Gene Ontology (GO) composition of the gene clusters on basis of the decision rules is presented. The rules are expressed as logical functions of the Gene Ontology terms which are interpreted as binary attributes. A new method for evaluating the quality of decision rules based on statistical significance is developed. The presented approach is applied to the well-known data set and the results are compared with the results obtained by other authors.
The rough sets theory is at present one of the most modern tools used for the analysis of tests results being specially loaded with considerable errors. The tests results of the surface fatigue life both the machines elements (e.g. rolling bearings) and their parts or specially made samples can be regarded as such results. The presented paper includes the analysis of the influence of different parameters of the surface layer of cylindrical rolling elements on their surface fatigue life spread. The analysis was made with the use of the rough sets theory.
Teoria zbiorów przybliżonych jest aktualnie jednym z najnowocześniejszych narzędzi służących do analizy wyników badań szczególnie obarczonych znacznymi błędami. Do takich wyników zaliczyć należy rezultaty badań powierzchniowej trwałości zmęczeniowej zarówno elementów maszyn (np. łożysk tocznych), jak i ich części składowych czy specjalnie wykonywanych próbek. W prezentowanym artykule zamieszczono analizę wpływu różnych parametrów warstwy wierzchniej walcowych elementów tocznych na rozrzut ich powierzchniowej trwałości zmęczeniowej. Analizy dokonano z wykorzystaniem teorii zbiorów przybliżonych.
W artykule opisano serwis internetowy netTRS, pozwalajacy na realizacje zadań eksploracji danych z wykorzystaniem biblioteki Tolerance Rough Sets, za pośrednictwem przeglądarki WWW. Dotychczas biblioteka TRS była dostępna jedynie w postaci standardowego programu wyposażonego w interfejs graficzny. Opisywany serwis pozwala na znacznie szersze niż do tej pory udostępnianie możliwości, które oferuje biblioteka, a także może być rozwijany w przyszłości.
This paper presents internet systems netTRS, which makes possible to analyse data, using TRS library and Internet browser. Until now, the library was accessible only as a local service with GUI.netTRS system makes it easier to use TRS library as a tool for induction and postprocessing of decision rules and can be developed in future.
This paper presents TRS library, which implements decision rules induction algorithms based on tolerance rough sets model. Algorithms used for filtering and approximating rules proposed by their authors arę significant part of the library. Until nów the library was available as a binary file or using command linę interpreter. Recently graphical user interface was created to simplify experiments and analysis.
W artykule opisano bibliotekę TRS, udostępniającą indukcję reguł decyzyjnych za pomocą tolerancyjnego modelu zbiorów przybliżonych. Ważną częścią biblioteki są zaproponowane przez jej autorów algorytmy, umożliwiające filtrację i uogólnianie wyznaczonych reguł. Dotychczas korzystanie z biblioteki było możliwe za pośrednictwem wersji skompilowanej lub poprzez opracowany interpreter skryptów, obecnie opracowano również interfejs użytkownika, dzięki czemu łatwiej można przeprowadzać eksperymenty i analizy.
Content available Rozstrzygnięcie konfliktów między regułami
W pracy przedstawiono metody klasyfikacji obiektów oparte na teorii zbiorów przybliżonych i sztucznych sieci neuronowych. Omówiono wyniki eksperymentów dotyczących klasyfikatorów zespołowych używających reguł decyzyjnych i sieci neuronowej do rozstrzygania konfliktów między nimi.
In this paper the methods of objects classification based on rough set theory and artificial neural networks are presented. The results of the experiments were discussed in relation to coupled classifier using decision rules and neural network to resolve the conflicts between them.
