Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!

Znaleziono wyników: 19

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
w słowach kluczowych:  classification trees
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
Stan techniczny infrastruktury komunalnej jest nieustannie w centrum zainteresowania z uwagi na konieczność utrzymania ustabilizowanej gospodarki wodnej, która może być zaburzona w sytuacji występowania wielu awarii i uszkodzeń sieci wodociągowej. Nie tylko liczba, ale również rodzaj uszkodzeń jest zmienną, która powinna być przedmiotem analiz technicznych, ekonomicznych i niezawodnościowych. W pracy przedstawiono porównanie wyników klasyfikacji uszkodzeń przewodów wodociągowych z wykorzystaniem dwóch metod opartych o założenia sztucznej inteligencji, czyli metody drzew klasyfikacyjnych i algorytmu sieci neuronowych. Celem pracy było sprawdzenie, czy trafność klasyfikacji w oparciu o perceptron wielowarstwowy będzie większa niż uzyskano to kilka lat temu w autorskich badaniach podczas analizy metody drzew klasyfikacyjnych. Do modelowania zastosowano dane eksploatacyjne z istniejącego jednego z większych systemów wodociągowych w Polsce. Przeanalizowano kilka wariantów różniących się od siebie rozmiarem wektora wejściowego. Uzyskane wyniki nie są zadowalające, gdyż tylko najbardziej licznie występujące w zbiorze danych uszkodzenia, zostały zaklasyfikowane poprawnie w ok. 80%, a w przypadku innych rodzajów uszkodzeń dokładność klasyfikacji była minimalna. W związku z tym konieczna wydaje się zmiana podejścia w kolejnych etapach pracy nad zagadnieniem przewidywania zmiennych jakościowych.
The technical condition of municipal infrastructure is continually in the centre of attention. It is necessary to maintain water management in stable conditions. Many failures of water pipes could lead to destabilize the whole water management in the cities. Not only the number of damage, but also their kinds should be analysed using technical, economical and reliability analysis. The comparison of classification results of kinds of water pipes damage using two artificial intelligence methods (classification trees and neural networks) was presented in the paper. The aim of the work was to check if classification accuracy using multilayer perceptron is higher than in other original investigations carried out several years ago when classification trees were analysed. Exploitation data from water supply system were used for modelling purposes. Several configurations with different size of input vector were investigated. Obtained results are not satisfactory. Only the most numerous classified in approx. 80%. For other kinds of failures the classification accuracy was minimal. It is necessary to change, in the next work stages, the investigation approach of quality variables prediction.
The research was focused on analyzing the causes of high-pressure die-casting defects, more specifically on casting leakage, which is considered perhaps the most important and common defect. The real data used for modelling was obtained from a high-pressure die-casting foundry that manufactures aluminum cylinder blocks for the world’s leading automotive brands. This paper compares and summarizes the results of applying advanced modelling using artificial neural networks, regression trees, and support vector machines methods to select artificial neural networks as the most effective method to perform a multidimensional optimization of process parameters to diagnose the causes of die-casting defects and to indicate the future research scope in this area. The developed system enables the prediction of the level of defects in castings with satisfactory accuracy and is therefore a highly relevant reference for process engineers of high-pressure foundries. This article indicates exactly which process parameters significantly influence the formation of a defect in a casting.
The purpose of this paper was to prove the role of the quality of online banking services in the shaping of consumer loyalty. Data specifying (1) consumer characteristics, (2) type and manner of using services and (3) levels of partial service quality assessments were analysed. Empirical research was carried out on a sample of 384 consumers, and the results were processed by performing a multidimensional exploratory analysis with the use of classification trees and the CTree algorithm. As a result, it was proven that for the identified types of loyalty, both cognitive and active-conative loyalty, the only statistically important predictors of consumer loyalty are some indicators of partial service qualities (6 in the first model and 4 in the second model). In this way, the rank of the quality in shaping of consumer behaviours in a digital economy was empirically proven.
Five models and methodology are discussed in this paper for constructing classifiers capable of recognizing in real time the type of fuel injected into a diesel engine cylinder to accuracy acceptable in practical technical applications. Experimental research was carried out on the dynamic engine test facility. The signal of in-cylinder and in-injection line pressure in an internal combustion engine powered by mineral fuel, biodiesel or blends of these two fuel types was evaluated using the vibro-acoustic method. Computational intelligence methods such as classification trees, particle swarm optimization and random forest were applied.
Celem artykułu jest zbadanie, jaka jest struktura użytkowników samochodów osobowych ze względu na wagę przypisywaną jakości części zamiennych oraz które predyktory kształtują tę strukturę. Jako metodę gromadzenia danych wykorzystano ankietę zrealizowaną na próbie 498 klientów serwisów samochodowych. Do identyfikacji nominalnych i porządkowych predyktorów oraz charakterystyki uzyskanych segmentów zastosowano drzewa klasyfikacyjne w oparciu o zaawansowany algorytm CART (Classification and Regression Trees). Implikacją teoretyczną jest budowa modelu klasyfikacji użytkowników samochodów ze względu na predyktory charakteryzujące badanych, pojazdy i sposób ich eksploatacji. Implikacją praktyczną jest dostarczenie rekomendacji istotnych przy projektowaniu i wytwarzaniu części zamiennych w celu efektywnej segmentacji rynku. Wkładem własnym autora i elementem nowości jest zastosowanie drzew klasyfikacyjnych w badanym obszarze, a także uzyskana segmentacja rynku.
The aim of the paper is to find out what the structure of passenger cars users concerning the weight ascribed to the quality of spare parts is and which predictors shape this structure. As a method of data acquisition a questionnaire filled in by 498 clients of garages was used. To identify nominal and ordinal predictors and characteristics of the obtained segments classification trees were used on a basis of the advanced CART (Classification and Regression Trees) algorithm. A theoretical implication is a construction of a model of car users according to the predictors characterizing users, vehicles and the way of their maintenance. A practical implication is a deliverance of recommendations important for an effective market segmentation when designing and manufacturing spare cars. Author’s contribution and a novelty element is the use of classification trees in the researched area, as well as the obtained market segmentation.
Project managers’ competencies are one of the factors that have the greatest impact on the success of a project. Therefore, a characteristic of a project manager is an important issue for each project based organization. The purpose of this research is to examine differences in the competencies of construction project managers in Podlasie (Poland) and Johor Province (Malaysia). As a result of that study a classification trees were constructed. The characteristics that differentiate competence of construction project managers are features related to personality (expressing confidence, self-confidence, intellectual abilities, creativity) and managerial competence (ability to assess the impact of action taken, ability to work in a team, ability to formulate goals, ability to deal with stress and ability to make decisions) of the project manager. The research results contribute to cross-cultural studies in project management through identification of features that differentiate project managers’ competencies in various countries.
Kompetencje kierowników projektów są jednym z czynników, które mają największy wpływ na powodzenie projektu. Dlatego też cechy kierownika projektu są ważną kwestią dla każdej organizacji opartej na projektach. Celem niniejszego badania jest zbadanie różnic w kompetencjach kierowników projektów budowlanych na terenie Podlasia (Polska) i prowincji Johor (Malezja). W wyniku tego badania zostały zbudowane drzewa klasyfikacyjne. Charakterystykami, które odróżniają kompetencje kierowników projektów budowlanych są cechy związane z osobowością (wyrażanie pewności, pewność siebie, zdolności intelektualne, kreatywność) oraz kompetencje kierownicze (zdolność do oceny skutków podjętych działań, umiejętność pracy w zespole, umiejętność formułowania celów, umiejętność radzenia sobie ze stresem i zdolność do podejmowania decyzji) kierownika projektu. Wyniki badań przyczyniają się do międzykulturowych badań w zarządzaniu projektami poprzez identyfikację cech, które odróżniają kompetencje kierowników projektu w różnych krajach.
In this paper, we deal with the problem of the initial analysis of data from evaluation sheets of subjects with autism spectrum disorders (ASDs). In the research, we use an original evaluation sheet including questions about competencies grouped into 17 spheres. An initial analysis is focused on the data preprocessing step including the filtration of cases based on consistency factors. This approach enables us to obtain simpler classifiers in terms of their size (a number of nodes and leaves in decision trees and a number of classification rules).
Współczesne organizacje, aby być konkurencyjne, muszą mieć umiejętności przetworzenia olbrzymich danych. Jednym z najbardziej obiecujących kierunków w tym zakresie jest wykorzystanie analityki predykcyjnej, opierającej się na algorytmach i modelach uczenia maszynowego. Związanych z tym jest wciąż wiele wyzwań, m.in. pytanie o „wejście” do takich modeli, czy powinny to być wszystkie dane zgromadzone przez organizację czy może raczej wcześniej wybrane zmienne? Celem artykułu jest zbadanie skuteczności algorytmów opartych na drzewach klasyfikacyjnych ze względu na liczebność predyktorów.
To stay competitive contemporary organizations have to master in processing massive amount of data. Predictive analytics, that is analytics based on machine learning algorithms and models, is one of the most promising directions. But there are many issues involved. One of them is the input to such models: should it be all data gathered by organization or just the selected variables? The aim of the article is to check how the number of predictors influences accuracy of classification algorithms based on trees.
Content available remote Fuzzy Rough Decision Trees
How to evaluate features and select nodes is one of the key issues in constructing decision trees. In this work fuzzy rough set theory is employed to design an index for evaluating the quality of fuzzy features or numerical attributes. A fuzzy rough decision tree algorithm, which can be used to address classification problems described with symbolic, real-valued or fuzzy features, is developed. As node selection, split generation and stopping criterion are three main factors in constructing a decision tree, we design different techniques to determine splits with different kinds of features. The proposed algorithm can directly generate a classification tree without discretization or fuzzification of continuous attributes. Some numerical experiments are conducted and the comparative results show that the proposed algorithm is effective compared with some popular algorithms.
The purpose of this article is to assess the economic growth of regions of the European Union in terms of their innovation. As a variable describing the assumed economic growth, GDP, and innovation - the input and output indicators defined by the standards of the EIS. It was assumed that economic growth has a regional dimension. Verification was made by classification trees.
The article presents a solution which allows to take in account the qualitative and quantitative features while modeling transaction prices of real estate apartments. The research material information concerned dwellings located within the city of Krakow, which have been sold in the period November 2008 – March 2009. Authors propose extension of the existing ways of testing the real estate market by multi--dimensional analysis, what will allow the comparison of impact of variables without assigning them numerical values. The solution is presented by the C&RT method (Classification and Regression Trees), which does not require scaling these attributes, as it can be described in a qualitative scale. This paper describes the optimal parameters of such models, thanks to which the creation of appropriate size tree is possible, that is a tree which allows the identification of rules which develop the property market in the selected districts. This proposal extends the existing research by taking into account the qualitative and quantitative features. It allows the introduction of an additional attribute, which is the location of a premises by a chosen street, which has been overlooked until now. Apart from defining the principles developing the general price of the real estate transaction, the features of the property have been lined up, showing the necessity of taking under consideration the address of the property.
W artykule przedstawiono rozwiązanie pozwalające na uwzględnienie cech jakościowych i ilościowych w modelowaniu ceny transakcyjnej nieruchomości lokalowych. Za materiał badawczy posłużyły informacje o lokalach mieszkalnych znajdujących się na terenie miasta Krakowa, które były przedmiotem sprzedaży w okresie listopad 2008 r. – marzec 2009 r. Autorzy proponują rozszerzenie dotychczas stosowanych sposobów badania rynku nieruchomości o wielowymiarowe analizy, pozwalające na porównanie wpływu zmiennych bez konieczności przypisywania im wartości liczbowych. Rozwiązanie takie przedstawiono, uwzględniając metodę C&RT (Classification and Regression Trees), niewymagającą przeskalowywania tych atrybutów, które można opisać w skali jakościowej. W pracy opisano optymalne parametry takiego modelu, dzięki którym możliwy jest proces utworzenia drzewa właściwej wielkości, czyli takiego, które pozwoli na wyłonienie reguł kształtujących rynek nieruchomości na terenie wybranych dzielnic. Propozycja ta rozwija dotychczasowy aparat badawczy przez jednoczesne uwzględnienie cech ilościowych i jakościowych. Umożliwia to wprowadzenie dodatkowego atrybutu, jakim jest położenie lokalu przy wybranej ulicy, co dotychczas było pomijane. Oprócz określania zasad kształtowania się ceny transakcyjnej nieruchomości przedstawione zostało uszeregowanie cech tych nieruchomości, wskazując na konieczność uwzględniania adresu lokalu w badaniu rynku.
Content available Metody statystyczne w segmentacji rynku
This article aims to present selected statistical methods that can be used in market research, particularly in market segmentation. Through the study (analysis) we understand the market science-based recognition of the market mechanism, structure, condition and development of its components in order to create the conditions for decision making. Market analysis is to create the conditions for decision-making within the marketing management. Is posed by the requirement that the analysis was not only a diagnosis of current market conditions and its past states, but also to represent a vision for the future. This forces the use of appropriate research methodology. No doubt the methods that significantly meet the above requirements are posed statistical methods. The paper will be presented including multivariate statistical methods that allow consumers to explore their needs, preferences, behavior in the market. The article presents the following statistical methods: cluster analysis, classification trees, correspondence analysis. The study was conducted among clients lingerie market.
Celem przeprowadzonych badań była statystyczne ocena przeżywalności 1201 jagniąt rasy merynos polski do wieku 56 dni z wykorzystaniem metod statystycznych: drzew klasyfikacyjnych oraz regresji logistycznej. Analizę statystyczną przeżywalności jagniąt (wyrażonej w skali binominalnej: l - przeżycie, O - upadek) przeprowadzono za pomocą techniki drzew klasyfikacyjnych Skonstruowano trzy modele drzew zróżnicowane kryterium tworzenia podziałów (funkcja entropii, wskaźnik Gini i test chi2). W celach porównawczych przeprowadzono dodatkowo analizę statystyczną za pomocą wielorakiej regresji logistycznej. Jakość skonstruowanych modeli drzew klasyfikacyjnych oraz regresji wielorakiej porównywano za pomocą następujących kryteriów: przeciętnej funkcji błędu, błędu średniego kwadratowego, liftu skumulowanego, pola pod krzywą ROC oraz statystyki Kołmogorowa-Smirnova. Analizę statystyczną przeprowadzono przy użyciu oprogramowania Enterprise Miner 6.1, wchodzącego w skład pakietu SAS. Obliczone kryteria jakości czterech skonstruowanych modeli pozwalają wnioskować, że drzewa klasyfikacyjne zbudowane w oparciu o wskaźnik Gini, a w dalszej kolejności o funkcję entropii w najlepszym stopniu opisują zmienność cechy jaką jest przeżywalność jagniąt do wieku 56 dni. W przypadku najlepszego modelu klasyfikacyjnego, tj. drzewa zbudowanego z wykorzystaniem wskaźnika Gini, ranking ważności zmiennych, jaki sporządzono na podstawie miary "Importance" pozwala wnioskować, że rok urodzenia jagnięcia najsilniej różnicuje zbiór danych. W dalszej kolejności wskazano na: typ urodzenia jagnięcia, masę ciała matek jagniąt w wieku 12 miesięcy, typ urodzenia dziadka jagnięcia, wiek ojca jagnięcia przy kryciu oraz kolejny wykot matki jagnięcia.
The aim of the present research was to analyse statistically the survival of 1201 Polish merino lambs up to 56 days of age using classification trees and logistic regression. Classification trees were applied in a statistical analysis of lamb survival rate (in binominal scale 1 - survival, O - mortality). Three different models of the trees were developed depending on division criterion (function of entropy, Gini index and chi-square test). For comparison purposes, an additional statistical analysis was carried out with a multiple logistic regression. The quality of decision tree models and multiple regressions was compared taking into consideration the following criteria: average error function, average squared error, lift cumulative, Kolmogorov-Smirnov statistics and the area under the ROC curve. A statistical analysis was conducted using the Enterprise Miner 6. l software included in the SAS package. The calculated quality criteria of four models that were developed lead to the conclusion that the classification trees established based on the Gini index, and then on the function of entropy, are most accurate in defining the variability of characteristics under the study, i. e. survival of lambs up to 56 days of age. In the case of the best classification model available, i.e. a tree built using the Gini idex, the ranking of variable importance that was developed based on the "Importance" measure leads to the conclusion that the year of a lamb's birth is the most significant differentiating factor. Then, other factors were: type of lamb's birth, body weight of mothers at 12 months of age, type of grandfather's birth, age of lamb's father at mating and successive lambing.
Development of a diagnostic decision support system using different then divalent logical formalism, in particular fuzzy logic, allows the inference from the facts presented not as explicit numbers, but described by linguistic variables such as the "high level", "low temperature", "too much content", etc. Thanks to this, process of inference resembles human manner in actual conditions of decision-making processes. Knowledge of experts allows him to discover the functions describing the relationship between the classification of a set of objects and their characteristics, on the basis of which it is possible to create a decision-making rules for classifying new objects of unknown classification so far. This process can be automated. Experimental studies conducted on copper alloys provide large amounts of data. Processing of these data can be greatly accelerated by the classification trees algorithms which provides classes that can be used in fuzzy inference model. Fuzzy logic also provides the flexibility of allocating to classes on the basis of membership functions (which is similar to events in real-world conditions). Decision-making in foundry operations often requires reliance on knowledge incomplete and ambiguous, hence that the conclusions from the data and facts may be "to some extent" true, and the technologist has to determine what level of confidence is acceptable, although the degree of accuracy for specific criteria is defined by membership function, which takes values from interval <0,1>. This paper describes the methodology and the process of developing fuzzy logic-based models of decision making based on preprocessed data with classification trees, where the needs of the diverse characteristics of copper alloys processing are the scope. Algorithms for automatic classification of the materials research work of copper alloys are clearly the nature of the innovative and promising hope for practical applications in this area.
In the presented article an impact of choose classification algorithm to his clasification abilities on the example neural networks and classification trees was compare. The database of finances describing the profession of the enterprise is an object of examinations. The database is covering over 1,600 records so one, should recognize conclusions to significant.
W artykule zaprezentowano nową koncepcję oceny odporności obiektów budowlach na terenach górniczych, przy wykorzystaniu drzew klasyfikacyjnych. Wykorzystując bazę ponad stu obiektów określono dla nich 12 zmiennych objaśniających i jedną zmienną objaśnianą - odporność. Wszystkie zmienne przedstawiono w skali porządkowej, z pominięciem przyporządkowanym im wartości liczbowych. Na tej podstawie utworzono drzewo klasyfikacyjne, które umożliwiło określenie reguł przynależności do odpowiedniej klasy wytrzymałości obiektu. W pracy posłużono się pakietem statystycznym Statistica 7.1, a jako rodzaj drzewa wybrano standardowe drzewa CRT z wdrożeniem.
In the article the concept of a new method of construction object resistance assessment in the mining areas using classification trees was presented. Database containing more than 100 construction objects was used to determinate their 12 independent variables and one dependent variable, which is resistance. On the basis of variables presented in ordinary scale, classification tree was created. Standard classification and regression trees (C&RT) were chosen as the best method for construction object resistance qualification. On the basis of classification tree, rules for assessment building resistance classification were formed. Statistica 7.1 software was used for this purpose. Diagram of classification tree is a final result of research. It is possible to execute estimation of resistance of surface structures on the basis of this diagram.
Content available remote Evaluation of some statistical methods for referring women for bone densitometry
The aim of our study is to design and compare some predictive models for estimating the Bone Mineral Density score (BMD) t-score. The data were collected, except the t-score, by self-report from 356 women recruited from the Cantacuzino Hospital, Bucharest, Romania, during the period 1998-2003. The following methods are tuned and compared on this data: the General Regression Model (GRM), the Classification Trees (CT) and the Multilayer Perceptrons Network (MLP). Comparatively with a number of different bone densitometry criteria, currently used in clinical practice, we show that each of the above investigated models have a better sensitivity and specificity.
W artykule przedstawiono wykorzystanie drzew decyzyjnych do wspomagania procesu podejmowania decyzji. Opisano rolę tych narzędzi w klasyfikacji i predykcji. Omówiono metodykę tworzenia drzew klasyfikacyjnych i ich implementację w pakiecie STATISTICA PL wersja 6.0. Zaprezentowano również przykład wykorzystania drzew klasyfikacyjnych do określenia reguł decyzyjnych.
The article presents the application of decision trees to support the decision-making process. The role of these tools in classification and prediction is described. It discusses the methodology of creating and implementing classification trees in STATISTICA PL version 6.0. In article the example of application of classification trees to define decision rules is presented.
W obszernym wprowadzeniu do zasadniczych wyników tej parcy przedstawiono dostępne wspołcześnie metody statystyki, przeznaczone do analizowania złóżonych struktur danych wielowymiarowych. Omawiane metody stanowią rozwinięcie klasycznych procedur, takich jak analiza wariancji, analiza czynnikowa, analiza tabel wielodzielczych, itp. Ogólnie rzecz ujmując pozwalają one na redukcję wymiarów analizowanej przestrzeni cech, bądź na zdejmowanie powiązań między cechami, z możliwością uwzględnienia wielkości niedostępnych bezpośrednio w pomiarach, a odzwierciedlających strukturę badanego systemu rzeczywistego. Procedury te są dostępne w postaci opcji lub modułów w większości komercyjnych pakietów statystycznych i praca niniejsza ma na celu między innymi ich spopularyzowanie w środowisku inżynierii rolniczej. Zastosowanie jednej z opisywanych metod (tzw. analizy równań strukturalnych zilustrowano na przykładzie danych opisujących techniczną infrastrukturę 112 gospodarstw indywidualnych regionu Polski Południowej. Praca jest kontynuacją badań nad różnymi metodami analizy wielowymiarowej przestrzeni cech opisujących techniczne wyposażenie gospodarstw. Uzyskane wyniki wskazują, że można tworzyć efektywne modele strukturalne badanych populacji, pozwalające na uproszczenie opisu oraz ułatwienie klasyfikacji złożonych struktur danych dotyczących technicznej infrastruktury.
An extensive introduction to results of this study presents recently available statistical methods designed to analyse the complex structure of multidimensional data. Discussed methods comprise the expansion of classical procedure, such as variance analysis, factor analysis, contigency table analysis etc. Generally, they enable to reduce the dimensions of analysed features' extent, or to find out the features' interrelations with the possibility of including the quantities that are inaccessible directly by measurements but reflect the structure of real system. The procedures, in form of options or moduli, are available in majority of commercial statistical packets; this work makes an attempt to popularize them in the environment of agricultural engineering. The application of one from among described methods, i.e. the structural equation analysis, was illustrated on an example of data describing technical infrastructure of 112 family farms in region of the southern Poland. Obtained results indicate the possibility of developing effective structural models of studied populations that enable to simplify the description and to make easier the classification of complex data structure dealing with the technical infrastructure of the farms.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.