In this paper, we deal with the problem of the initial analysis of data from evaluation sheets of subjects with autism spectrum disorders (ASDs). In the research, we use an original evaluation sheet including questions about competencies grouped into 17 spheres. An initial analysis is focused on the data preprocessing step including the filtration of cases based on consistency factors. This approach enables us to obtain simpler classifiers in terms of their size (a number of nodes and leaves in decision trees and a number of classification rules).
The primary goal of pattern recognition is supervised or unsupcrvised classification in order to solve decision - making problems. Medical diagnosis brings about many practical problems, which may be interpreted as pattern recognition tasks. Making diagnosis of a given patient means to solve a classification problem - we must recognize patient’s disease on the basis on some symptoms. The aim of the article is to present the results of using selected pattern recognition algorithms to classify patients with Coronary Artery Disease undergoing Coronary Artery Bypass Grafting (CABG).
Five models and methodology are discussed in this paper for constructing classifiers capable of recognizing in real time the type of fuel injected into a diesel engine cylinder to accuracy acceptable in practical technical applications. Experimental research was carried out on the dynamic engine test facility. The signal of in-cylinder and in-injection line pressure in an internal combustion engine powered by mineral fuel, biodiesel or blends of these two fuel types was evaluated using the vibro-acoustic method. Computational intelligence methods such as classification trees, particle swarm optimization and random forest were applied.
The objective of this paper is to assess the participation of adults in Poland in lifelong learning. The participation in education of Poles aged 25-64 was analyzed at three levels: national, regional and individual. The data at the national level were confronted with the situation in Europe and the data at the voivodeships level were considered in the context of regional competitiveness. The main factors influencing the educational involvement at the individual level were detected by the application of classification trees. The results of the analysis indicate that lifelong learning in Poland is not sufficiently developed and some regional differences occur in this field. The educational attainment was found as the most important determinant of the participation in continuous learning.
W artykule zaprezentowano nową koncepcję oceny odporności obiektów budowlach na terenach górniczych, przy wykorzystaniu drzew klasyfikacyjnych. Wykorzystując bazę ponad stu obiektów określono dla nich 12 zmiennych objaśniających i jedną zmienną objaśnianą - odporność. Wszystkie zmienne przedstawiono w skali porządkowej, z pominięciem przyporządkowanym im wartości liczbowych. Na tej podstawie utworzono drzewo klasyfikacyjne, które umożliwiło określenie reguł przynależności do odpowiedniej klasy wytrzymałości obiektu. W pracy posłużono się pakietem statystycznym Statistica 7.1, a jako rodzaj drzewa wybrano standardowe drzewa CRT z wdrożeniem.
In the article the concept of a new method of construction object resistance assessment in the mining areas using classification trees was presented. Database containing more than 100 construction objects was used to determinate their 12 independent variables and one dependent variable, which is resistance. On the basis of variables presented in ordinary scale, classification tree was created. Standard classification and regression trees (C&RT) were chosen as the best method for construction object resistance qualification. On the basis of classification tree, rules for assessment building resistance classification were formed. Statistica 7.1 software was used for this purpose. Diagram of classification tree is a final result of research. It is possible to execute estimation of resistance of surface structures on the basis of this diagram.
Content available remote Fuzzy Rough Decision Trees
How to evaluate features and select nodes is one of the key issues in constructing decision trees. In this work fuzzy rough set theory is employed to design an index for evaluating the quality of fuzzy features or numerical attributes. A fuzzy rough decision tree algorithm, which can be used to address classification problems described with symbolic, real-valued or fuzzy features, is developed. As node selection, split generation and stopping criterion are three main factors in constructing a decision tree, we design different techniques to determine splits with different kinds of features. The proposed algorithm can directly generate a classification tree without discretization or fuzzification of continuous attributes. Some numerical experiments are conducted and the comparative results show that the proposed algorithm is effective compared with some popular algorithms.
The research was focused on analyzing the causes of high-pressure die-casting defects, more specifically on casting leakage, which is considered perhaps the most important and common defect. The real data used for modelling was obtained from a high-pressure die-casting foundry that manufactures aluminum cylinder blocks for the world’s leading automotive brands. This paper compares and summarizes the results of applying advanced modelling using artificial neural networks, regression trees, and support vector machines methods to select artificial neural networks as the most effective method to perform a multidimensional optimization of process parameters to diagnose the causes of die-casting defects and to indicate the future research scope in this area. The developed system enables the prediction of the level of defects in castings with satisfactory accuracy and is therefore a highly relevant reference for process engineers of high-pressure foundries. This article indicates exactly which process parameters significantly influence the formation of a defect in a casting.
Classification trees included in SQL Server 2008R2 Analysis Services package have been used to classify Polish households based on their incomes. The analysis has been performed by means of the three algorithms and their effectiveness has been measured. Using the best algorithm a groups of households with the lowest and the largest incomes have been distinguished. The most important attributes describing households with the lowest and the largest incomes were identified and discussed.
Niniejsza publikacja stanowi próbę scharakteryzowania deterministycznych czynników wpływających na wygraną w pokera. Przeprowadzono analizę w oparciu o jedną z metod eksploracji danych – drzewa klasyfikacyjne. Wybór tej techniki podyktowany był wykorzystaniem danych jakościowych jako zmiennych objaśniających rozgrywkę pokerową oraz prostotą prezentacji otrzymanych wyników, nawet przy bardzo rozbudowanych drzewach. W badaniu odkryto kilka czynników, które w istotny sposób mają wpływ na przebieg gry.
The paper aims to characterize key factors determining poker game outcome. The analysis was based on classification trees and this was due to the qualitative data used as the explanatory variables. The method enables clear presentation of the results even in case of very complex tree structures. The study describes also a few other factors that significantly influence the game outcome.
In the presented article an impact of choose classification algorithm to his clasification abilities on the example neural networks and classification trees was compare. The database of finances describing the profession of the enterprise is an object of examinations. The database is covering over 1,600 records so one, should recognize conclusions to significant.
Rok 2015 był bardzo udany dla segmentu telekomunikacji oraz sprzętu IT w branży teleinformatycznej. Uzyskane wyniki metodą drzewa klasyfikacyjnego do zadań decyzyjnych wskazują na to, że w najbliższym czasie „informatyczne” żniwa będa optymistyczne szczególnie dla sprzetu IT. Poprawność prognostyczna była sprawdzona przy uzyciu współczynnika błędu po 10-krotnej walidacji krzyżowej, który wskazał na bardzo dobre dopasowanie modelu do danych. Zatem prawdopodobne jest, że sprzęt IT będzie predykantem w branży IT. Kolejno oszacowano najwyższe przychody ze sprzedaży, które uzyskali dostawcy usług telekomunikacyjnych, rozwiązań i usług IT dla sektora telekomunikacyjnego oraz rozwiązań i sprzętu telekomunikacyjnego. Przy czym, segment sprzętu IT według procentowego odsetku w łącznych zarobkach we wszystkich segmentach branzy IT osiąga tylko o 4% mniejsze zyski niż telekomunikacja.
Year 2015 was very successful for the segment of telecommunications and IT equipment in the ICT sector. The results of the classification tree method of decision tasks indicate that in the near future „ information technologies” harvest will be particularly optimistic for IT equipment. The correctness of prognostic was checked by using error rate after a 10-fold cross-validation, which pointed to a very good fit model to the data. Sequentially estimated the highest revenue from sales, which obtained providers of telecommunications services, IT solutions and services for the telecommunications sector as well as solutions and telecommunications equipment. While, the segment of IT equipment according to the percentage of the total earnings in all segments of the IT industry reached only 4% less profits than telecommunications.
Content available remote Wybrane aspekty zachowań oszczędnościowych gospodarstw domowych w Polsce
W artykule podjęto próbę identyfikacji czynników determinujących stopę oszczędzania gospodarstw domowych. W badaniach wykorzystano dane jednostkowe krajowych gospodarstw domowych pochodzące z Diagnozy Społecznej oraz zastosowano regresję logistyczną i drzewa klasyfikacyjne. Wyniki przeprowadzonych badań wykazały, że stopa oszczędności gospodarstw domowych w Polsce jest w największym stopniu determinowana przez takie ich cechy społeczno-ekonomiczne, jak: płeć, wiek, poziom wykształcenia głowy gospodarstwa domowego, a także dochód gospodarstwa. Uzyskane w pracy wyniki korespondują generalnie z wynikami innych krajowych i zagranicznych badań.
This article presents an attempt of identification the factors determining Polish households’ saving rate. In the research were used individual data of Polish households coming from Social Diagnosis database. Logistic regression and classification trees methods were used. The results of conducted analysis show, that important factors of saving rate are: gender, education level of household’s head and household’s income.
The purpose of this article is to assess the economic growth of regions of the European Union in terms of their innovation. As a variable describing the assumed economic growth, GDP, and innovation - the input and output indicators defined by the standards of the EIS. It was assumed that economic growth has a regional dimension. Verification was made by classification trees.
The article presents a solution which allows to take in account the qualitative and quantitative features while modeling transaction prices of real estate apartments. The research material information concerned dwellings located within the city of Krakow, which have been sold in the period November 2008 – March 2009. Authors propose extension of the existing ways of testing the real estate market by multi--dimensional analysis, what will allow the comparison of impact of variables without assigning them numerical values. The solution is presented by the C&RT method (Classification and Regression Trees), which does not require scaling these attributes, as it can be described in a qualitative scale. This paper describes the optimal parameters of such models, thanks to which the creation of appropriate size tree is possible, that is a tree which allows the identification of rules which develop the property market in the selected districts. This proposal extends the existing research by taking into account the qualitative and quantitative features. It allows the introduction of an additional attribute, which is the location of a premises by a chosen street, which has been overlooked until now. Apart from defining the principles developing the general price of the real estate transaction, the features of the property have been lined up, showing the necessity of taking under consideration the address of the property.
W artykule przedstawiono rozwiązanie pozwalające na uwzględnienie cech jakościowych i ilościowych w modelowaniu ceny transakcyjnej nieruchomości lokalowych. Za materiał badawczy posłużyły informacje o lokalach mieszkalnych znajdujących się na terenie miasta Krakowa, które były przedmiotem sprzedaży w okresie listopad 2008 r. – marzec 2009 r. Autorzy proponują rozszerzenie dotychczas stosowanych sposobów badania rynku nieruchomości o wielowymiarowe analizy, pozwalające na porównanie wpływu zmiennych bez konieczności przypisywania im wartości liczbowych. Rozwiązanie takie przedstawiono, uwzględniając metodę C&RT (Classification and Regression Trees), niewymagającą przeskalowywania tych atrybutów, które można opisać w skali jakościowej. W pracy opisano optymalne parametry takiego modelu, dzięki którym możliwy jest proces utworzenia drzewa właściwej wielkości, czyli takiego, które pozwoli na wyłonienie reguł kształtujących rynek nieruchomości na terenie wybranych dzielnic. Propozycja ta rozwija dotychczasowy aparat badawczy przez jednoczesne uwzględnienie cech ilościowych i jakościowych. Umożliwia to wprowadzenie dodatkowego atrybutu, jakim jest położenie lokalu przy wybranej ulicy, co dotychczas było pomijane. Oprócz określania zasad kształtowania się ceny transakcyjnej nieruchomości przedstawione zostało uszeregowanie cech tych nieruchomości, wskazując na konieczność uwzględniania adresu lokalu w badaniu rynku.
Young adults’ relationships with their parents change throughout their shared family life. Young adults who are ready to leave the family home usually have developed communication patterns with their parents. The COVID-19 pandemic time changed the natural course of many processes in society, including thedynamics of family relationships. Some young people were forced to return to the family home, and their motivation was extrinsic, which may have affected the quality of relationships between young people and their parents. In this article, we indicate the dynamics and nature of changes in the relationship between parents and young people returning to the family home. We identify variables, conditioning relationships for individual characteristics such as broadening and adoption derived from the CEI-II questionnaire. Other variables include age, gender, and assessment of relationships with parents before and during the COVID-19 pandemic, time spent talking to parents before and during the pandemic, topics discussed in conversations with parents, areas of conflict in relationships with parents, and emerging emotions toward parents. The research tool was a self-administered survey questionnaire. The study population was people aged 18-25, and the research sample is 568 from all over Poland. The survey was conducted using the CAWI method. Correlationcoefficient for ordinal variables, non-parametric tests (Wilcoxon test for pairs of observations), and decision classification trees were applied in order to determine the qualitative classification of the relationship with the parents in the context of obtaining high scores in terms of expanding knowledge and experiences and accepting the uncertain and unpredictable nature of everyday life. The main results of the study lead to a resolution indicating that the relationship of young people with their mother, in the subjective assessment has slightly deteriorated, the relationship with the father has not changed, those who obtain high scores in broadening have better relationships with their parents than those with low and medium scores. COVID-19, family relationships, teenagers, classification trees
Relacje młodych osób z rodzicami ulęgają zmianie na przestrzeni wspólnego życia rodzinnego. Młode osoby gotowe do opuszczenia domu rodzinnego zazwyczaj posiadają już wypracowane wzorce komunikacji z rodzicami. Czas pandemii COVID-19 zmienił naturalny bieg wielu zachodzących w społeczeństwie procesów, w tym dynamikę relacji rodzinnych. Część młodych osób zmuszona została do powrotu do domu rodzinnego, a ich motywacja była zewnątrzsterowna, to mogło wpłynąć na jakość relacji między młodymi osobami a ich rodzicami. Podjęty w niniejszym artykule problem badawczy brzmiał: Jakie zmiany zachodzą w relacjach młodych osób z ich rodzicami w sytuacji powrotu do domu rodzinnego ze względu na pandemię COVID-19? Określamy zmienne warunkujące zależności dla cech jednostki takich jak poszerzanie i przyjmowanie pochodzące z kwestionariusza CEI-II. Pozostałe zmienne to: wiek, płeć oraz ocena relacji z rodzicami przed pandemią COVID-19 i w jej trakcie, czas spędzony na rozmowach z rodzicami przed pandemią i w jej trakcie, tematy -podejmowane w rozmowach z rodzicami, obszary konfliktowe w relacjach z rodzicami oraz pojawiające się emocje wobec rodziców. Narzędziem badawczym był autorski kwestionariusz ankietowy. Badaną populację stanowiły osoby w wieku 18-25, a próba badawcza to 568 osób z całej Polski. Badanie przeprowadzone zostało metodą CAWI. Zastosowano miary zależności dla cech porządkowych, testy nieparametryczne (test Wilcoxona dla par obserwacji) oraz drzewa klasyfikacyjne w celu określenia klasyfikacji jakościowej relacji z rodzicem w kontekście uzyskiwania wysokich wyników w kategoriach poszerzania wiedzy i doświadczeń oraz przyjmowania niepewnego i nieprzewidywalnego charakteru życia codziennego. Główne wyniki badań prowadzą do rozstrzygnięcia wskazującego, że relacje młodych osób z matką w czasie pandemii, w subiektywnej ocenie, nieznacznie się pogorszyły, a relacje z ojcem nie uległy zmianie. Osoby, które uzyskują wysokie wyniki w kategorii poszerzanie mają lepsze relacje z rodzicami niż osoby o niskich i średnich wynikach.
Celem artykułu jest identyfikacja i hierarchizacja czynników decydujących o wyborze destynacji polskich bezpośrednich inwestycji zagranicznych poza obszarem Unii Europejskiej. Przedmiotem badania są czynniki o charakterze kosztowym, rynkowym, efektywnościowym, prawnym, społecznym i politycznym, które mogą mieć znaczenie dla poszukiwania beneficjentów BIZ. W artykule posłużono się danymi pochodzącymi z badania ankietowego przeprowadzonego wśród polskich przedsiębiorstw podejmujących BIZ lub planujących tę formę inwestowania. Do klasyfikacji firm zastosowano drzewa decyzyjne tworzone zgodnie z procedurą CART. Metoda ta umożliwiła stworzenie profili przedsiębiorstw o zbliżonej polityce inwestycyjnej w zakresie priorytetów wyboru destynacji BIZ. W badaniu wykazano, że najważniejsze przy wyborze destynacji BIZ na terenie pozaunijnych państw europejskich okazywały się czynniki prawne i kosztowe, a w przypadku destynacji pozaeuropejskich ważne były także czynniki polityczne. Priorytetowe traktowanie czynników prawnych może oznaczać, że część polskich firm jest zainteresowana inwestycjami BIZ w postaci przepływów finansowych (tzw. kapitał w tranzycie) i stosuje optymalizację podatkową.
The purpose of this article is to identify the main factors determining the choice of Polish foreign direct investment (FDI) destination outside the EU. The research includes the cost, market, efficiency, legal, social and political factors which may be important in the search for the beneficiaries of FDI. Data from a survey conducted among companies investing in FDI or planning this form of investment were used in the analysis. To classify the companies, decision trees were used, and created in accordance with a CART algorithm. These research methods enable the creation of company profiles with similar investment policies in terms how they prioritize their choice of investment destination. The study showed that when choosing a destination for FDI in European countries that are not EU members, the legal and cost factors were the most important, while political factors were also important in non-European destinations. The prominence of the legal factors may mean that some Polish companies are interested in FDI in the form of financial flows (ie. capital in transit) and tax optimisation.
Content available remote Evaluation of some statistical methods for referring women for bone densitometry
The aim of our study is to design and compare some predictive models for estimating the Bone Mineral Density score (BMD) t-score. The data were collected, except the t-score, by self-report from 356 women recruited from the Cantacuzino Hospital, Bucharest, Romania, during the period 1998-2003. The following methods are tuned and compared on this data: the General Regression Model (GRM), the Classification Trees (CT) and the Multilayer Perceptrons Network (MLP). Comparatively with a number of different bone densitometry criteria, currently used in clinical practice, we show that each of the above investigated models have a better sensitivity and specificity.
Project managers’ competencies are one of the factors that have the greatest impact on the success of a project. Therefore, a characteristic of a project manager is an important issue for each project based organization. The purpose of this research is to examine differences in the competencies of construction project managers in Podlasie (Poland) and Johor Province (Malaysia). As a result of that study a classification trees were constructed. The characteristics that differentiate competence of construction project managers are features related to personality (expressing confidence, self-confidence, intellectual abilities, creativity) and managerial competence (ability to assess the impact of action taken, ability to work in a team, ability to formulate goals, ability to deal with stress and ability to make decisions) of the project manager. The research results contribute to cross-cultural studies in project management through identification of features that differentiate project managers’ competencies in various countries.
Kompetencje kierowników projektów są jednym z czynników, które mają największy wpływ na powodzenie projektu. Dlatego też cechy kierownika projektu są ważną kwestią dla każdej organizacji opartej na projektach. Celem niniejszego badania jest zbadanie różnic w kompetencjach kierowników projektów budowlanych na terenie Podlasia (Polska) i prowincji Johor (Malezja). W wyniku tego badania zostały zbudowane drzewa klasyfikacyjne. Charakterystykami, które odróżniają kompetencje kierowników projektów budowlanych są cechy związane z osobowością (wyrażanie pewności, pewność siebie, zdolności intelektualne, kreatywność) oraz kompetencje kierownicze (zdolność do oceny skutków podjętych działań, umiejętność pracy w zespole, umiejętność formułowania celów, umiejętność radzenia sobie ze stresem i zdolność do podejmowania decyzji) kierownika projektu. Wyniki badań przyczyniają się do międzykulturowych badań w zarządzaniu projektami poprzez identyfikację cech, które odróżniają kompetencje kierowników projektu w różnych krajach.
Celem przeprowadzonych badań była statystyczne ocena przeżywalności 1201 jagniąt rasy merynos polski do wieku 56 dni z wykorzystaniem metod statystycznych: drzew klasyfikacyjnych oraz regresji logistycznej. Analizę statystyczną przeżywalności jagniąt (wyrażonej w skali binominalnej: l - przeżycie, O - upadek) przeprowadzono za pomocą techniki drzew klasyfikacyjnych Skonstruowano trzy modele drzew zróżnicowane kryterium tworzenia podziałów (funkcja entropii, wskaźnik Gini i test chi2). W celach porównawczych przeprowadzono dodatkowo analizę statystyczną za pomocą wielorakiej regresji logistycznej. Jakość skonstruowanych modeli drzew klasyfikacyjnych oraz regresji wielorakiej porównywano za pomocą następujących kryteriów: przeciętnej funkcji błędu, błędu średniego kwadratowego, liftu skumulowanego, pola pod krzywą ROC oraz statystyki Kołmogorowa-Smirnova. Analizę statystyczną przeprowadzono przy użyciu oprogramowania Enterprise Miner 6.1, wchodzącego w skład pakietu SAS. Obliczone kryteria jakości czterech skonstruowanych modeli pozwalają wnioskować, że drzewa klasyfikacyjne zbudowane w oparciu o wskaźnik Gini, a w dalszej kolejności o funkcję entropii w najlepszym stopniu opisują zmienność cechy jaką jest przeżywalność jagniąt do wieku 56 dni. W przypadku najlepszego modelu klasyfikacyjnego, tj. drzewa zbudowanego z wykorzystaniem wskaźnika Gini, ranking ważności zmiennych, jaki sporządzono na podstawie miary "Importance" pozwala wnioskować, że rok urodzenia jagnięcia najsilniej różnicuje zbiór danych. W dalszej kolejności wskazano na: typ urodzenia jagnięcia, masę ciała matek jagniąt w wieku 12 miesięcy, typ urodzenia dziadka jagnięcia, wiek ojca jagnięcia przy kryciu oraz kolejny wykot matki jagnięcia.
The aim of the present research was to analyse statistically the survival of 1201 Polish merino lambs up to 56 days of age using classification trees and logistic regression. Classification trees were applied in a statistical analysis of lamb survival rate (in binominal scale 1 - survival, O - mortality). Three different models of the trees were developed depending on division criterion (function of entropy, Gini index and chi-square test). For comparison purposes, an additional statistical analysis was carried out with a multiple logistic regression. The quality of decision tree models and multiple regressions was compared taking into consideration the following criteria: average error function, average squared error, lift cumulative, Kolmogorov-Smirnov statistics and the area under the ROC curve. A statistical analysis was conducted using the Enterprise Miner 6. l software included in the SAS package. The calculated quality criteria of four models that were developed lead to the conclusion that the classification trees established based on the Gini index, and then on the function of entropy, are most accurate in defining the variability of characteristics under the study, i. e. survival of lambs up to 56 days of age. In the case of the best classification model available, i.e. a tree built using the Gini idex, the ranking of variable importance that was developed based on the "Importance" measure leads to the conclusion that the year of a lamb's birth is the most significant differentiating factor. Then, other factors were: type of lamb's birth, body weight of mothers at 12 months of age, type of grandfather's birth, age of lamb's father at mating and successive lambing.
