Content available remote Zastosowania kopuli niesymetrycznych w modelowaniu ekonomicznym
Wielowymiarowa analiza danych ekonomicznych w wielu przypadkach musi uwzględniać fakt niewymienności badanych czynników. Taką swoistą asymetrię danych daje się modelować przy użyciu kopuli niesymetrycznych. W opracowaniu przedstawiona jest pewna procedura tworzenia dwuwymiarowych kopuli niesymetrycznych. Procedura ta zilustrowana jest analizą przykładowych danych empirycznych, w przypadku których - na podstawie stosownego testu statystycznego - uprzednio rozpoznana została asymetria. Mimo znacznej złożoności modeli bazujących na kopulach niesymetrycznych i pewnych trudności stąd wynikających, odnotować należy ich zdecydowaną przewagę w sensie większej adekwatności merytorycznej i elastyczności dopasowania w porównaniu z tradycyjnie używanymi modelami bazującymi na kopulach archimedesowych.(abstrakt oryginalny)
In many cases, multidimensional analysis of economic data must take into consideration non-exchangeability of deliberated factors. Such a peculiar data asymmetry may be modelled with use of asymmetric copulas. In the paper a specific procedure of 2- dimensional asymmetric copula construction is presented and, additionally, illustrated with an analysis of exemplary empirical data, asymmetry of which was previously identified on the basis of a proper test. Despite complexity of asymmetric copula models and some further difficulties caused by them, the presented analysis reveals much higher accuracy and elasticity of asymmetric copula models in comparison with the traditional Archimedean ones.(original abstract)
tom 33
nr nr 198
Zdefiniowano współczynnik zależności prostoliniowej rozumiany jako kosinus kąta, pod jakim przecinają się proste regresji. Podobnie jak klasyczny współczynnik korelacji współczynnik zależności prostoliniowej jest asymptotycznie normalny. Tak jak w przypadku prostych regresji można zdefiniować pojęcie stożkowych regresji. Jest to przykład współczynnika zależności nieliniowej, który można określić, wychodząc od współczynnika zależności prostoliniowej. Dalej przedstawiono wielośrednią, uogólnienie klasycznego pojęcia wartości oczekiwanej zmiennej losowej. Średnia może być uważana za aproksymację średniokwadratową zmiennej losowej jednym punktem. Wielośrednia jest aproksymacją zmiennej więcej niż jednym punktem jednocześnie. Przy definiowaniu wielośredniej korzysta się ze standardowej metody momentów oraz faktów z teorii wielomianów ortogonalnych. (abstrakt oryginalny)
In this paper we talk about new statistic tools which enable more precise eco¬nomic data analysis. Firstly, we define line dependent coefficient as a cosine of angle made of the cross of regression lines. It is the base, thanks to which we can define other nonlinear relation coefficients. Just like the classic correlation coefficient, line dependent coefficient is also asymptotically normal. Natural expansion of the line function class are conics. As incase of regression lines, we can define regression conics (their equations vary in lineal parts). Conic dependent coefficient is a cosine of cross angle of regression conics (we choose cross point, which is the nearest from the set of points barycentre). It is the example of non-linear dependent coefficient, which can be defined on the basis of line dependent coefficient. The second part of this article is about multiaverage, generalization of the clas¬sic expected value of the random variable idea. The average may be considered as root- mean-square average approximation of the random variable with one point. Multiaverage is approximation of the variable with more than just one point at the same time. While defining multiaverage, we use standard moments method and some facts from the orthogonal polynomial theory. (abstrakt oryginalny)
The study covers content analysis of the european uprising news represented in Turkish Media. 12 mainstream Turkish newspapers has been analysed between the dates of 1th - 30th July 2011. Correspodence analysis and mosaic plots has been used in order to develop a better picture. The news about "European uprising" found in only 65 newspapers of 236. As the main result, it can be stated that The uprising news in different newspapers on the same date are associated with the newspaper's perspective about democracy, human rights and global citizenship. (original abstract)
Artykuł przedstawia jedną z metodyk realizacji Data Mining zwaną SEMMA. Metodyka ta w prosty i skuteczny sposób wspomaga przeprowadzanie złożonego procesu, jakim jest eksploracja danych. Została opracowana i zaimplementowana przez producenta oprogramowania do eksploracji danych Enterprise Miner, amerykańską firmę SAS Institute, Inc.. Opisano tutaj dokładnie kroki postępowania, które składają się na tą metodologię czyli Sample, Explore, Modify, Model, Assess. Do każdego z tych etapów przedstawiono poszczególne narzędzia operowania danymi. Dla Sample są to Input Data Source, Sampling, Data Partition. Narzędzia Explore to Distribution Explorer, Multiplot, Insight, Association, Variable Selection, Link Analysis. Do etapu Modify zaliczamy narzędzia Data Set Attributes, Transform Variables, Filter Outliers, Re-placement, Clustering, SOM/Kohonen, Tim Series. Narzędzia Model to Regression, Tree, Neural Network, Princomp/Dmneural, User Defined Model, Ensemble, Memory-Based Reasoning, Two Stage Model. Narzędzia ostatniego etapu Assess to Assessment i Reporter. Oprócz narzędzi należących do kroków metodyki SEMMA opisano także narzędzia z dwóch grup węzłów: Scoring i Utility. Zaprezentowano także reguły, których należy przestrzegać przy budowie diagramów analizy danych. Dla ilustracji przetwarzania według metodyki SEMMA przedstawiono przykład analizy Data Mining za pomocą narzędzi SAS Enterprise Miner. Przykład dotyczy prognozowania posiadania komputera z dostępem do Internetu w gospodarstwach domowych na podstawie wybranych cech gospodarstwa. Porównywana jest jakość dwóch modeli predyktywnych: regresji logistycznej i sieci neuronowych. (abstrakt oryginalny)
The article presents the Data Mining process based on SEMMA methodology. It regards matching of the data mining process to the general strategy of problems solution by the business or research unit. Ali six stages are characterized on the base of the best practices. The article will facilitate the successful application of SEMMA methodology in practice. (original abstract)
Braki odpowiedzi są zjawiskiem coraz powszechniej występującym w badaniach, zwłaszcza kwestionariuszowych. Standardową procedurą używaną w takiej sytuacji jest analiza pełnych obserwacji, czyli usunięcie obserwacji niepełnych i oparcie analiz na pełnych rekordach. Strategia taka zazwyczaj prowadzi do błędnego wnioskowania statystycznego. W pracy przed¬stawione zostały grupy metod stosowanych w analizie danych niepełnych. Wyróżniono wśród nich między innymi tzw. metody imputacji, w której brakujące elementy w zbiorze danych są zastępowane ich oszacowaniami. (abstrakt oryginalny)
Celem tego artykułu będzie przedstawienie jednej z metod służących do estymacji (oszacowania) wartości cech ukrytych. (fragment tekstu)
This article presents the latent trait models. It describes how to use the Rasch model to estimate student's ability and item difficulty. The author defines the problem and describes how to build such model. The main method which was used to find the parameter estimators is the maximum likelihood method. Next, the author ilustrates how to use this model when we have some data. Finally, the author focuses on graphic method of verification of that model. (original abstract)
Artykuł stanowi próbę uzupełnienia teorii działań arytmetycznych na rzeczywistych liczbach rozmytych. Celem zawartych w nim rozważań jest znalezienie rozwiązania problemu działania odwrotnego w arytmetyce rozmytej oraz związanego z nim zagadnienia równania z jedna niewiadomą. (abstrakt oryginalny)
The article submits an attempt at supplementing the theory of arithmetic operations on real fuzzy numbers. The goal of considerations is to find a solution to the problem of inverse operation in a fuzzy arithmetic and to the connected issue of equation with one unknown. (original abstract)
nr nr 27
Bezpieczeństwo staje się coraz częściej analizowanym zagadnieniem związanym z pojęciem pracy. Powodem tego jest wciąż bardzo duża liczba wypadków przy pracy. Celem artykułu jest analiza statystyczna charakteryzująca wypadki powstałe przy pracy w Polsce w latach 1993-2008. Dodatkowo artykuł został wzbogacony o prognozę liczby wypadków przy pracy w Polsce na rok 2009 wyznaczoną metodą minimum błędu ex ante. ( abstrakt oryginalny)
Safety becomes much more frequently analyzed issue connected with the concept of work. Big number of accidents at work is the reason for that situation. The aim of the article is the statistical analysis describing accidents at work in Poland in years 1993-2008. Additionally t he a rticle h as b een e nriched by t he p rognosis of number of accidents at work in Poland for year 2009 set method minimum of mistake ex ante. (original abstract)
Content available remote Ewolucja struktury podmiotowej rynku w Polsce
Celem artykułu jest statystyczna analiza zmian liczby przedsiębiorstw ogółem w Polsce w latach 1995-2009 oraz opis zaobserwowanych zmian w strukturze podmiotowej rynku. Przy zastosowaniu odpowiednich metod ilościowych podjęto próbę oceny stopnia ewolucji procentowego udziału przedsiębiorstw prowadzących działalność według poszczególnych sekcji PKD w ogólnej liczbie podmiotów gospodarki narodowej zarejestrowanych w systemie REGON. Dodatkowo zaproponowano model prognostyczny celem otrzymania krótkoterminowej prognozy liczby firm ogółem w Polsce - na koniec 2011 roku.(abstrakt oryginalny)
The aims of the paper are both a statistical analysis of changes in a total number of enterprises in Poland in years 1995-2009 and a description of the observed changes in the structure of the entities in the market. By means of the appropriate quantitative methods there has been made an attempt to assess the degree of evolution of the percentage of companies from different sections of PKD in the total number of economic entities registered in the REGON system. An attempt has been made also to build an adequate prognostic model to obtain the short-term forecasts of the total number of companies in Poland - at the end of 2011.(original abstract)
Content available remote Próba konstrukcji wskaźników złożonych w testach koniunktury
Wskaźniki złożone w testach koniunktury są zazwyczaj konstruowane w sposób arbitralny. W artykule przedstawiono sposób konstrukcji wskaźników złożonych z wykorzystaniem informacji zawartych w danych. Rozważania przedstawiono na przykładzie badań ankietowych prowadzonych przez GUS w przemyśle przetwórczym. (original abstract)
The composite indicators in economic tests are usually constructed in an arbitrary way. The paper presents the method of the construction of composite indicators with the usage of the information included in the data. The considerations are presented with the help of surveys by GUS (Central Statistical Office of Poland) in processing industry. (original abstract)
Celem artykułu jest analiza przesłanek, zasad funkcjonowania i perspektyw rozwojowych specyficznej inicjatywy „statystycznej” sektora samorządowego pod nazwą system analiz samorządowych (SAS), a przede wszystkim odpowiedź na pytanie: czy inicjatywa ta ma rację bytu przy widocznym rozwoju profesjonalnie prowadzonych banków lub subbanków danych lokalnych w ramach statystyki publicznej? Ostatecznym celem artykułu jest zatem identyfikacja słabych i mocnych stron tej inicjatywy. (fragment tekstu)
The methods for analyzing cross-classified tables are usually to test relations between two variables taken one pair at a time. Further development of those methods allowed to move from two dimensional tables to high dimensional tables, where dimensionality of a cross-table refers to the number of variables. It allowed to transform nonmodel- based to model-based methods providing the equation of a mathematical model, the use of estimation method and variety of visualizing tools. This paper describes how complex qualitative data may be described by a mathematical model. One of the method presented is log-linear analysis.
Celem artykułu jest zaproponowanie nowej metody klasyfikacji rozmytej na potrzeby analizowania danych symbolicznych interwałowych. W artykule przedstawiono podstawowe pojęcia z zakresu analizy danych symbolicznych, klasyfikacji spektralnej oraz rozmytej klasyfikacji c-średnich. W części empirycznej przedstawiono wyniki badań symulacyjnych dla sztucznych zbiorów danych wygenerowanych w programie R.(abstrakt oryginalny)
The main aim of the paper is to present a proposal of new fuzzy clustering method for symbolic interval-valued data. The paper presents basic terms of symbolic data, spectral clustering and fuzzy c-means clustering. In the empirical part results of simulation study with application of artificial data sets obtained from R software are presented.(original abstract)
The purpose of this article is to present the algorithm of fourfold display as the method used in the analysis based on binary, socio-economic nominal variables. In order to identify the advantages and disadvantages of this method correspondence analysis was introduced to study as an alternative method. To demonstrate possible applications of the method were used data from the European Social Survey (improving knowledge/skills: course/lecture/conference depending on age, gender, country and having a job. Conducted analyzes showed that the greater variation in the perception of training courses occurs between older and younger people. Because of the gender differences are no longer significant.
This paper proposes a model for the development of fund goods in German Democratic Republic. General remarks about the methods of construction of such model are given. The last part of the paper concentrates on the utility of such model for purposes of economic planning in socialist countries. In addition, example is included. (original abstract)
nr nr 355
W artykule przedstawiono zakres analizowanych danych (rozwój lotnictwa pasażerskiego w Iraku za lata 1971-1984). Na koniec omówiono prezentację oszacowanych modeli regresji oraz analizę otrzymanych wyników.
The results of the empirical studies aiming at choosing the best regression models for the selected variables describing Iraqi air transport are presented. The studies were "based on the data covering the period of 1971-1984. The analysis was carried out using Hellwig method of diagnostic variable selection. The studies comprised two versions differing in the sets of the possible diagnostic variables. In the case of the first version the set included macroeconomic (external) variables. The other version allowed additional, "internal" variables referring to air transport.(original abstract)
Podstawą do przeprowadzenia dynamiczno-przekrojowego badania taksonomicznego są informacje statystyczne dotyczące kształtowania się cech diagnostycznych z zestawu X w zbiorze obiektów ekonomicznych P w przedziale czasu C. (fragment tekstu)
The report presents the method of taxonomic classification for the set of multi-featured socio-economic units in the successive periods of time from a previously defined time interval.Special attention has been paid to examining consistency of the classification results for: 1. economic units in successive periods of time from a defined time interval and 2. time periods in separate units of the set defined. (original abstract)
W artykule zaprezentowano podstawy teoretyczne modelu pełnego wraz z przykładem który uwzględnia wszystkie interakcje zachodzące między zmiennymi. W literaturze, obok modelu pełnego, istnieje wiele innych modeli, które wykorzystywane są do badania zależności między zmiennymi o charakterze dychotomicznym, jednak tematyka ta ze względu na rozległość tematyczną zasługuje na odrębny projekt. Brak literatury w języku polskim na temat analizy logarytmiczno-liniowej sprawia, że jest to obszar do poszukiwania nowych rozwiązań i stanowi pewną lukę w obszarze analizy danych o charakterze jakościowym. (fragment tekstu)
Content available remote Imputation of Missing Data Using R Package
W praktycznych zastosowaniach metod statystycznych często pojawia się problem występowania w zbiorach danych brakujących wartości. W takich sytuacjach wykorzystać można metody imputacji danych, polegające na zastąpieniu brakujących danych konkretnymi wartościami w celu uzyskania kompletnego zbioru danych. W referacie dokonano przeglądu metod imputacji danych oraz opisano możliwości wykonania koniecznych obliczeń z wykorzystaniem dostępnych w środowisku R pakietów realizujących procedury imputacji jednostkowej i wielokrotnej. (abstrakt oryginalny)
Missing data are quite common in practical applications of statistical methods. Imputation is general statistical method for the analysis of incomplete data sets. The goal of the paper is to review selected imputation techniques. Special attention is paid to methods implemented in some packages working in the R environment. An example is presented to show how to handle missing values using a few procedures of single and multiple imputation implemented in R. (original abstract)
Podejście wielomodelowe dotychczas z dużym powodzeniem stosowane było w dyskryminacji w celu podniesienia dokładności klasyfikacji. Analogiczne propozycje pojawiły się także w taksonomii, aby zwiększyć poprawność i stabilność wyników grupowania. Stabilność algorytmu taksonomicznego w odniesieniu do niewielkich zmian w zbiorze danych (np. wybór podzbioru zmiennych), czy też parametrów algorytmu (np. losowa inicjalizacja algorytmu) jest pożądaną cechą algorytmu. Głównym punktem zainteresowania tego referatu jest stabilność w podejściu zagregowanym taksonomii. Zasadniczym celem jest przeprowadzenie badań empirycznych, które mają za zadanie porównać stabilność metody bagging stosowanej do klasycznego zbioru danych oraz do tzw. macierzy współwystąpień. (abstrakt oryginalny)
Ensemble approach has been successfully applied in the context of supervised learning to increase the accuracy and stability of classification. Recently, analogous techniques for cluster analysis have been suggested in order to increase classification accuracy, robustness and stability of the clustering solutions. Research has proved that, by combining a collection of different clusterings, an improved solution can be obtained. The stability of a clustering algorithm with respect to small perturbations of data (e.g., data subsampling or small variations in the feature values) or the parameters of the algorithm (e.g., random initialization) is a desirable quality of the algorithm. On the other hand, ensembles benefit from diverse clusterers. Although built upon unstable components, the ensemble is expected to be more accurate and robust than the individual clustering method. Here, we look at the stability of the ensemble methods based on bagging idea and co-occurrence matrix. This paper carries out an experimental study to compare stability of bagging method used to the classical data set with bagging based on co-occurrence matrix. (original abstract)
