Celem artykułu jest analiza własności metody random forest oraz porównanie trafności predykcji za pomocą tej metody z wynikami uzyskanymi przy zastosowaniu pojedynczego modelu. (fragment tekstu)
Random forest is one of the methods for aggregation of classification models. It combines bagging with random variable selection for building each of tree-based component models. Many experiments proved that this aggregation leads to the reduction of classification error and improvement of prediction accuracy in comparison with other methods (e.g. bagging, boosting). In this paper we discuss the main properties of the method and compare results of prediction based on random forest with results obtained from single tree-based model. (original abstract)
Agregacja ocen eksperckich jest zadaniem bardzo trudnym. Świadczy o tym fakt, że badania w tym zakresie prowadzone są od kilkudziesięciu co najmniej lat, opracowano dużo metod agregacji, a badania nie ustają, co świadczy o ciągłym naukowym niezadowoleniu badaczy. Obecnie trudno jest powiedzieć, która z istniejących metod agregacji jest obiektywnie najlepsza. Przyczyną tego stanu rzeczy jest brak jednolitego stanowiska świata naukowego w kwestii modelowania niepewności (oceny eksperckie są niepewne). Do modelowania niepewności, z którą w życiu codziennym i w działalności firm mamy nieustannie do czynienia, stosuje się różne podejścia.(fragment tekstu)
Content available remote Special Cases of Some General Formula for Price Indices
W pracy prezentujemy ogólną formułę dla agregatowych indeksów cen, która spełnia większość postulatów wywodzących się z aksjomatycznej teorii indeksów. Pokazano, że wiele powszechnie znanych i użytecznych indeksów statystycznych stanowi szczególny przypadek omawianej formuły. (abstrakt oryginalny)
In the paper we present a general formula for aggregative price indices that satisfies most postulates coming from the axiomatic price index theory. We show that a lot of known and useful price indices are particular cases of the discussed formula. (original abstract)
Podejście wielomodelowe oparte na agregacji modeli jest z powodzeniem wykorzystywane w zagadnieniach dyskryminacyjnych i regresyjnych. Niemniej jednak podejście to może zostać także zastosowane w zagadnieniu klasyfikacji. W wielu artykułach wskazuje się, że połączenie wielu różnych klasyfikacji pozwala otrzymać lepsze wyniki. Artykuł przedstawia możliwość zastosowania podejścia wielomodelowego w klasyfikacji danych symbolicznych. W artykule przedstawiono także wyniki klasyfikacji z wykorzystaniem podejścia wielomodelowego. (abstrakt oryginalny)
Ensemble approaches based on aggregated models have been applied with success to discrimination and regression tasks. Nevertheless this approach can be applied to cluster analysis tasks. Many articles have proved that, by combining different clusterings, an improved solution can be obtained. The article presents the possibility of applying ensemble approach based on aggregated models to cluster symbolic data. The paper presents also presents results of clustering obtained by applying ensemble approach. (original abstract)
Celem pracy jest konstrukcja operatora agregacji uwzględniającego zależności zachodzące między cechami badanych obiektów. Zależności te, nie uwzględniane przez klasyczny operator jakim, jest średnia ważona, są modelowane za pomocą monotonicznej funkcji zbiorów. W pracy zaprezentowano podejście aksjomatyczne, tzn. przedstawiono listę własności "dobrego" operatora agregacji, a następnie wyznaczono klasę operatorów posiadających te własności. Przyjęto, że operator ten powinien być liniowy ze względu na monotoniczną funkcję zbioru przedstawiającą zależności zachodzące między cechami, zgodny z tą funkcją zbioru, niemalejący oraz niezmienniczy względem przedziałowej skali pomiaru wartości cech. Pokazano, że jedynymi operatorami agregacji spełniającymi te warunki są operatory oparte na całce Choqueta względem tych funkcji zbioru. Natomiast operatory stabilne ze względu na porządkowe skale pomiaru związane są z max-min funkcjami Boole'a. Innym operatorem liniowym względem monotonicznej funkcji zbioru jest wieloliniowy operator zaproponowany przez Carlucciego i Pisaniego. W paragrafie 2 przedstawiono ważoną średnią arytmetyczną i jej uogólnienie - całkę Choqueta względem monotnicznej funkcji zbioru. Listę własności "dobrze" określonego operatora agregacji zaprezentowano w paragrafie 3. Z kolei paragraf 4 omawia ważne pojęcie współmonotoniczności, ściśle związane z całką Choqueta. Podano w nim również inną charakteryzację całek Choqueta. Rodzaje operatorów agregacji opartych na całkach Choqueta przedstawiono w paragrafie 5. Natomiast sposoby określania współczynników wyznaczających omawiane operatory stanowią treść paragrafu 6. Ostatni paragraf zawiera przykład zastosowania omawianego operatora agregacji, Jest to miernik jakości życia w województwach. (fragment tekstu)
The construction of aggregation operator taking account relation between attributes of investigated objects is presented. The axiomatic approach based on the assumption of the linearity of this operator with respect to the monotonic set function modeling such relations is introduced. Such aggregation operator ought to be consistent with this set function, nondecreasing and stable with respect to the interval measurement scale of value of the attributes. It is shown that the Choquet integral is the only aggregation operator satisfying above conditions. If we assume the stability with respect to the ordinal scale we obtain the Boolean max-min function. The types of aggregation operators based on the Choquet integral and the construction of the index of quality of life in provinces are presented. (original abstract)
Rozmyty analityczny proces hierarchiczny (Fuzzy Analytic Hierarchy Process - FAHP) jest metodą służącą do określenia ważności priorytetowych czynników rozwoju jednostek samorządu terytorialnego. W metodzie tej konstruowany jest schemat hierarchicz-ny obejmujący priorytetowe czynniki. Następnie czynniki te oceniane są parami przez eks-pertów i agregowane. Agregacja informacji uzyskanych od ekspertów może zostać prze-prowadzona różnymi sposobami. W pracy porównano trzy główne podejścia dotyczące agregacji ocen parami priorytetowych czynników rozwoju dokonanych przez ekspertów. Celem pracy jest porównanie różnych sposobów agregacji opinii ekspertów i ich wpływu na oceny priorytetowych czynników rozwoju - wartości priorytetów globalnych. Proponowane podejścia zostały zastosowane do oceny priorytetowych czynników rozwoju w gminie Kleszczewo w województwie wielkopolskim w 2014(abstrakt oryginalny)
Fuzzy analytical hierarchical process (FAHP) allows us to quantify the priority factors of development in local administrative units (LAU). In this method, the scheme of the priority factors influencing the development of LAU is constructed. Then factors are compared pairwise by experts and aggregated. The aggregation of the information obtained from the experts may be carried out in various ways. The study compares three major approaches. The study aims at comparing different methods of aggregation of the experts' opinions and their impact on the assessment of priority development factors - the value of global priorities. The proposed approach has been used to assess the priority factors of development in Kleszczewo municipality in Wielkopolskie voivodship in 2014(original abstract)
Content available remote Determining Models of Influence
nr nr 2
We consider a model of opinion formation based on aggregation functions. Each player modifies his opinion by arbitrarily aggregating the current opinion of all players. A player is influential on another player if the opinion of the first one matters to the latter. Generalization of an influential player to a coalition whose opinion matters to a player is called an influential coalition. Influential players (coalitions) can be graphically represented by the graph (hypergraph) of influence, and convergence analysis is based on properties of the hypergraphs of influence. In the paper, we focus on the practical issues of applicability of the model w.r.t. a standard framework for opinion formation driven by Markov chain theory. For a qualitative analysis of convergence, knowing the aggregation functions of the players is not required, one only needs to know the set of influential coalitions for each player. We propose simple algorithms that permit us to fully determine the influential coalitions. We distinguish three cases: a symmetric decomposable model, an anonymous model, and a general model. (original abstract)
Addytywna metoda budowy drzew regresyjnych (MART), została zaproponowana przez J. H. Friedmana w 1999 r. (1999a, b). Jest to jedna z metod agregacyjnych, mająca zastosowanie w regresji i dyskryminacji opierająca się na modelach w postaci drzew. Jej zaletami, poza dokładnością predykcji, jest odporność na wartości oddalone i braki danych. Bardzo dobrze radzi sobie również z dużą liczbą zmiennych objaśniających, wśród których wiele może nie mieć istotnego wpływu na zmienną zależną. W artykule przedstawiona została ogólna idea metod agregacyjnych. Zaprezentowano i omówiono kolejne kroki algorytmu MART, a następnie, dla ilustracji, podany został przykład zastosowania procedury MART dla zbioru danych "Boston". (abstrakt oryginalny)
Multiple additive regression trees MART is a methodology for trying to solve prediction problems in regression and classification. It's one of the boosting methods. It was introduced by J. H. Friedman (1999a). Besides accuracy, its primary goal is robustness. It tends to be resistant against outliers, missing values, and the inclusion of potentially large numbers of irrelevant predictor variables that have little or no effect on the response. In this paper the MART algorithm and their applications will be discussed. (original abstract)
W pracy autorzy zajmują się wyznaczeniem metod agregacji dla pewnych problemów alokacyjnych. Autorzy opracowania uogólniają wyniki otrzymane wcześniej przez J. Aczéla, C.T. Ng oraz C. Wagnera, dopuszczając sytuacje, gdy liczba osób wartościujących zmienne decyzyjne niekoniecznie jest skończona. Dokładniej, autorzy dopuszczają agregowanie opinii, które są obrazowane poprzez funkcje ciągle lub zmienne losowe. Rozważają też przypadek, gdy oceny mają wartości niekoniecznie liczbowe, lecz mogą być elementami pewnych przestrzeni liniowych. (fragment tekstu)
Content available remote Metoda agregacji bilansującej w kwalifikacji strategii rozwoju technologii
W artykule przedstawiono opis przypadku zastosowania metody agregacji bilansującej w ocenie strategii rozwoju technologii. Metoda agregacji bilansującej została rozbudowana o elementy metody AHP w zakresie badania spójności porównań parami. Przedmiotem analizy było 20 technologii, które były oceniane przez 94 ekspertów z punktu widzenia determinant wewnętrznych (mocne i słabe strony) oraz determinant zewnętrznych (szanse i zagrożenia). W badaniach przyjęto założenie, że identyfikacja determinant powinna zostać uzupełniona o elementy analizy ilościowej, której wyniki pomogą w opracowaniu ostatecznego rankingu badanych technologii. Identyfikacja czynników warunkujących rozwój wybranych technologii stanowiła punkt wyjścia w ocenie ich relatywnego znaczenia i ocenie ważonej. Zastosowanie agregacji bilansującej pozwoliło na dokonanie kwalifikacji strategii rozwoju badanych technologii oraz opracowanie ramowego programu rozwoju wsparcia dla biznesu w województwie małopolskim(abstrakt oryginalny)
The article presents a case of the use of the balanced aggregation method in the evaluation of technology development strategy. The balanced aggregation method has been expanded with elements of AHP method in respect of the study of cohesion pairwise comparisons. The case describes the analysis of 20 technologies that were judged by 94 experts from the point of view of the determinants of internal (strengths and weaknesses) and external determinants (opportunities and threats). The identification of the factors conditioning the development of selected technologies was the starting point in assessing their relative importance and weighted evaluation. The use of aggregation allowed to choose technology strategies and develop a framework program of business support in the Małopolska Voivodeship(original abstract)
The integration of activities in the company is related to the effective transformation of the strategy into tactical and operational activities and the establishment of a system of repeatable and legible actions for both employees and clients. In this fact, formation will become a network of dynamic activities in the area of shaping processes that cross traditional functional areas of an enterprise. The Integrated Management System will become an element facilitating the formation process, which is usually confirmed by accepted standards of quality, environment and safety management (including the current flow of information and risk) and hygiene of job as well as appropriate and confirmed relations with a selected group of clients. The combination of such requirements results in arrangement and systematic operation in the organi-zation of the company. This article is an attempt to show the integration of activities in an enterprise as a tool for effective formation of the business activities, on the basis of possessed knowledge and an empirical casa study performed in the company that is a leader in this industry and located on the stock exchange. The article also takes into account the principles and techniques appearing in the wide application of the project management with underlining its dynamic character.(original abstract)
Celem artykułu jest wykorzystanie łączenia modeli rynków o dwupunktowych rozkładach prawdopodobieństwa do łączenia rynków wielookresowych. Wielookresowe modele składowe dane na sieci dwumianowej, poddane agregacji metodą Klaassena, sprowadza się do modeli o rozkładzie dwupunktowym. Dla modeli: cen akcji CRR i cen obligacji na sieci dwumianowej podano zagregowane ceny oraz zagregowane prawdopodobieństwa martyngałowe. Warunkiem zastosowania procedury łączenia do wymienionych modeli zagregowanych jest równość czynników dyskontujących za dany wielookresowy przedział czasu. Zagregowane modele spełniają wtedy założenia o łączonych modelach składowych; są zupełne, pozbawione możliwości arbitrażu i mają wspólną cenę wielookresowego instrumentu bezpiecznego. Otrzymano rozszerzenie metody łączenia na modele rynków wielookresowych.(abstrakt oryginalny)
The aim of the paper is the application of the joining method introduced for the models with the two-point probability distribution to the multiperiod markets.The multiperiod models, given on the binomial web, are aggregated using the Klaassen method, resulting in the two-point distribution. For the CRR stock prices model and for the bond prices model on the binomial web, the aggregated prices and the aggregated martingale probabilities are given. The condition of applying the joining procedure is the equality of discount factors for both models in the multiperiod time interval. Then both aggregated models verify the assumptions needed for the joining procedure. This way we have obtained the extension of the joining method on the multiperiod models.(original abstract)
W firmie ubezpieczeniowej zarządza się wieloma klasami ryzyka, w których część wpłat może być powodowana przez te same czynniki ryzyka. Czynniki te możemy traktować jako zewnętrzne czynniki ryzyka. Natomiast czynniki ryzyka powodujące wypłaty tylko w jednej klasie ryzyka można traktować jako wewnętrzne czynniki ryzyka. Jednoczesne oddziaływanie zewnętrznych czynników ryzyka na różne klasy ryzyka może skutkować jednoczesnym pojawianiem się wpłat w tych klasach, których wysokość może być zależna od siebie. Do tej pory w literaturze zależność ta nie była uwzględniana w modelach ryzyka dla kilku klas ryzyka, tzw. wieloklasowych modelach ryzyka. Celem niniejszej pracy jest przedstawienie wyników numerycznej analizy wpływu stopnia zależności pomiędzy jednocześnie pojawiającymi się wypłatami na prawdopodobieństwo ruiny w skończonym horyzoncie czasowym w modelu ryzyka dla dwóch klas ubezpieczeń. (fragment tekstu)
These paper considers a risk model for two dependant classes of insurance business. The dependence between these classes is caused by appearing of some claims at the same time in both classes and additionally the sizes of these claims are dependant. The structure of the dependence between these claims sizes is described by copulas. The main aim of the paper is to investigate the impact of the level of dependence between these claims sizes on the finite-time ruin probability in considered risk model. short numerical analysis. (original abstract)
Tematem pracy jest zastosowanie operatorów agregacji w zagadnieniach związanych z wielokryterialnym podejmowaniem decyzji. Operatory te są tam stosowane do agregacji kryteriów. W tym celu zaproponowano wykorzystanie całek Choqueta. Są one odpowiednim operatorem agregacji, ponieważ stanowią uogólnienie ważonej średniej arytmetycznej oraz uwzględniają wzajemne zależności zachodzące między kryteriami. Zapewniają też stabilność ze względu na skalę pomiaru. Scharakteryzowano klasę operatorów agregacji opartych na całkach Choqueta uwzględniając listę naturalnych własności operatorów tego typu. Przedstawiono też podstawowe metody identyfikacji wag zależnych kryteriów. (abstrakt oryginalny)
The application of aggregation operators in multicriteria decision making problems has been discussed in the paper. These operators are used to aggregate criteria in such problems. A class of aggregation operators based on Choquet integrals has been characterized taking into account a list of natural properties of operators of this type. Basic methods for identification of weights of interactive criteria are also presented. (original abstract)
W niniejszym artykule przedstawione zostaną teoretyczne podstawy dla działania metody agregacji modeli w oparciu o wielowymiarowe dekompozycje danych. W metodzie tej traktujemy zbiór rezultatów predykcji jako wielowymiarową zmienną, zawierającą destrukcyjne dla wyniku prognozy ukryte komponenty. Wykorzystanie technik dekorelujących dane oraz dekompozycja błędu średniokwadratowego pozwala na identyfikacje i eliminuję komponentów destrukcyjnych. Prowadzi to do poprawy wyników predykcji. Potwierdzeniem skuteczności metody jest praktyczny eksperyment prognozowania zużycia energii elektrycznej. (abstrakt oryginalny)
In this paper we present the theoretical background for ensemble methods via multivariate decompositions. Having a set of models we treat their results as a multivariate variable with destructive and constructive latent components. The data decorrelation and MSE error decompositions provide to proper destructive components identification and elimination. The elimination of destructive components should improve final prediction. The validity of the approach is verified by energy load prediction problem. (original abstract)
Jednym z kluczowych problemów w wielomodelowym podejściu do zagadnienia regresji jest estymacja optymalnej ilości modeli bazowych. Jeśli ich ilość jest zbyt mała - rośnie błąd predykcji, zbyt duża ilość powiększa czas i komplikację obliczeń. Niestety estymacja tej ilości na podstawie analizy błędu predykcji może prowadzić do jej przeszacowania. W artykule proponuje się formalne podejście, w którym porównywane są wyniki prognoz otrzymanych z modeli zagregowanych z różnej liczby modeli bazowych. W tym przypadku wykorzystane zostały zarówno testy parametryczne jak i testy permutacyjne, a jako dane testowe: dane empiryczne wykorzystywane w przemyśle rafineryjnym. (abstrakt oryginalny)
One of the crucial problems in multiple-model approach of the regression is estimation of optimal number of base models. If the quantity is too low - it increases the prediction error whereas too high number of models increases time and complication of calculations. Unfortunately, the estimation of the quantity of base models based on the analysis of prediction error can lead to its overestimation. This paper proposes a formal approach where the predictions obtained with the models aggregated from different number of base models are compared. In this approach both: parametric and permutation tests were applied with the empirical data from petroleum industry. (original abstract)
W artykule pokazano, że problem agregacji modeli ekonometrycznych może być przedstawiony w kategoriach analizy zmian strukturalnych. W ogólnym przypadku, makroparametry zależą od odpowiadających mikroparametrów oraz współczynników struktury zmiennych objaśniających. Nawet w przypadku, gdy mikroparametry są stałe w czasie, makroparametry zmieniać się mogą w ślad za zmianami struktury zmiennych objaśniających.
In the paper there is presented a method of aggregation of linear and log-linear econometric relations, using side information on structure of variables to be aggregated. Generally, the method produces macrorelations with variable parameters but free of aggregation errors. Macroparameters are functions of microparameters and coefficients of structure of explanatory variables. In correctly specified macrorelation constancy of microparameters is not sufficient for the macroparameters to be constant. (original abstract)
Content available remote On Types of Responsiveness in the Theory of Voting
nr nr 2
In mathematics, monotonicity is used to denote the nature of the connection between variables. Hence for example, a variable is said to be a monotonically increasing function of another variable if an increase in the value of the latter is always associated with an increase in the other variable. In the theory of voting and the measurement of a priori voting power one encounters, not one, but several concepts that are closely related to the mathematical notion of monotonicity. We deal with such notions focusing particularly on their role in capturing key aspects of plausible opinion aggregation. Further, we outline approaches to analyzing the relationship of opinion aggregation and voting power and thereby contribute to our understanding of major components that determine the outcome of voting. (original abstract)
Presence of long-memory in the series is an important feature to take into account in applied work. There are several methods and indicators of the long-memory, based on nonparametric and parametric methods (such as Hurst indicator, estimates of fractional integration parameter with periodogram regression of GPH type, ARFIMA and FIGARCH models, etc.) We compare results of applying three of them (the Geweke and Porter-Hudak method, the modified rescaled range statistic, the Robinson's periodogram regression) to time-series data of exchange rates, with logarithms of daily data, weekly and monthly averages, and to daily, weekly and monthly returns. The series in question are the daily average exchange rates of the National Bank of Poland. Results presented show that a proper choice of long-memory detecting method merit careful attention. (original abstract)
