Opracowanie dotyczy konstruowania klasyfikatorów diagnostycznych. Jego celem jest zwrócenie uwagi na celowość dekompozycji złożonych modeli diagnostycznych oraz pokazanie oryginalnego sposobu identyfikacji cech relewantnych, na podstawie danych uczących występujących w postaci zbioru przykładów. Wskazano możliwość zastosowania kryterium bazującego na zgodności wyników grupowania w nowej ograniczonej przestrzeni z wynikami klasyfikacji wzorcowej.
EN
The paper deals with design of diagnostic classifiers. The main goal is to present the usefulness of diagnostic model decomposition and to illustrate an original way of identification of useful signal features on the basis of learning data prepared as a set of examples. One indicated some possibilities of application of a criterion based on the expectation that results of unsupervised clustering in a new limited space should be compatible with results of classification of learning data.
Multidimensional Scaling method makes it possible to show the configuration of multivariate objects in the space with less dimensions than the original one (usually on the plane) in such a way that a distance matrix calculated in lower dimension is the most similar to the distance matrix calculated in the original multivariate space. The application of this approach for the analysis of spatio-temporal structures is presented in the paper. Structures are described by shares, so no standardisation (or normalisation) is needed to eliminate the measurement units. Separate Multidimensional Scaling is performed for each time point. On the sequence of results we can follow the changes of object position. Those trajectories can be approximated by trend functions. The example considered in the paper deals with the employment structure in 28 European Union countries in 1999–2016. Structures are calculated on the basis of 10 aggregated sections of the economy.
PL
Skalowanie wielowymiarowe to metoda pozwalająca na przedstawienie obserwacji złożonych w przestrzeni o mniejszej liczbie wymiarów (zazwyczaj na płaszczyźnie) w taki sposób, aby macierz odległości liczonych na płaszczyźnie była jak najbardziej podobna do macierzy liczonej w przestrzeni oryginalnej. W pracy przedstawiono propozycję wykorzystania tego podejścia w analizie struktur przestrzenno-czasowych. Struktury są opisane udziałami, zatem nie jest konieczna procedura doprowadzania udziałów do porównywalności ze względu na jednostkę miary. Dla każdej jednostki czasu przeprowadzane jest osobne skalowanie wielowymiarowe. Ciąg wyników pozwala śledzić przemieszczanie się badanych obiektów względem innych w zbiorze. Te trajektorie można aproksymować funkcjami trendu. Rozważany przykład merytoryczny to analiza struktur zatrudnienia w 28 krajach Unii Europejskiej w latach 1999–2016. Struktury te liczone są w podziale na 10 zagregowanych sekcji.
The main problems of qualimetrical measurements for quality assessment as a new metrology trend are considered in this paper. The conceptual notion of the qualimetrical measurement is proposed and developed. The main problems of realization procedure are considered and its solution variants are analyzed. The methodology of results uncertainty assessment of qualimetrical measurements is developed. The correlations between individual single studied product quality values are taken into account. It helps to assess objectively the quality of qualimetrical measurements.
PL
W pracy przedstawiono główne problemy dotyczące metodologii pomiarów kwalimetrycznych, które można określić jako nowy trend w dyscyplinie metrologia. Zaproponowano i opracowano pojęcie mierzenia kwalimetrycznego jako pośredniego pomiaru danej wielkości, której wartość określa się poprzez opracowanie wyników pomiarów według metodologii skalowania wielowymiarowego. Przeprowadzono analizę metodologii oceny pomiarów kwalimetrycznych, przy wykorzystaniu teorii niepewności. Przedstawiono podstawowe problemy realizacji procedur pomiarów kwalimetrycznych i przeanalizowano sposoby ich rozwiązania. Zgodnie z teorią pomiaru, rozwiązano zagadnienie syntezy miary jakości produktu, jako jednego z kluczowych elementów realizacji pomiarów kwalimetrycznych. Wprowadzono pojęcie wirtualnej miary jakości produktu, która jest odpowiednikiem teoretycznym realnej, fizycznej miary jakości. Przedstawiono problem wykorzystania metodologii skalowania wielowymiarowego w pomiarach kwalimetrycznych, w tym analizę i uzasadnienie zastosowania modelu trójmodalnego skalowania wielowymiarowego. Otworzyło to możliwość oceny poziomu jakości badanego produktu. Zaproponowano metody szacowania niepewności wyników pomiarów kwalimetrycznych, biorąc pod uwagę różne stopnie skorelowania pomiędzy poszczególnymi wskaźnikami jakości produktów badanych. Stworzyło to możliwość oceny jakości tych pomiarów. Ponadto, dzięki nowej metodologii pomiarów kwalimetrycznych jest możliwość osiągnięcia jednoznaczności pomiarów.
In multidimensional scaling carried out on the basis of metric data matrix (interval, ratio) one of the stages is the choice of the variable normalization method. The R package clusterSim with data.Normalization function has been developed for that purpose. It provides 18 data normalization methods. In this paper the proposal of procedure which allows to isolate groups of normalization methods that lead to similar multidimensional scaling results were presented. The proposal can reduce the problem of choosing the normalization method in multidimensional scaling. The results are illustrated via empirical example.
PL
W skalowaniu wielowymiarowym przeprowadzanym na podstawie macierzy danych metrycznych (przedziałowych, ilorazowych) jednym z etapów jest wybór metody normalizacji wartości zmiennych. W badaniu zastosowano funkcję data.Normalization pakietu clusterSim programu R. Funkcja ta zawiera 18 różnych metod normalizacyjnych. W artykule zaproponowano procedurę badawczą pozwalającą na wyodrębnienie grup metod normalizacji wartości zmiennych prowadzących do zbliżonych wyników skalowania wielowymiarowego. Propozycja pozwala ograniczyć problem wyboru metody normalizacji wartości zmiennych w skalowaniu wielowymiarowym. Wyniki zilustrowano przykładem empirycznym.
The purpose of the article is to analyse the cases of contestation of decisions in the Council of the European Union during voting on legislative acts in the ordinary legislative procedure, in the period 2009–2014. In the first step, two research hypotheses were delineated. The first one assumed the dominance of the coalition culture in voting, the second one assumed the opposite, the dominance of the culture of consensus. In addition, two further hypotheses were delineated which assumed conflicts in the European Union between the countries of the north and south and between the “old” vs. “new” Union. In order to verify the hypotheses, a multidimensional scaling technique was applied. Empirical analysis confirmed that the dominant culture of voting is the culture of consensus. Despite this, several countries strongly emphasised their separate positions, trying to form coalitions. Moreover, conflicts between the north and south Europe and the “new” and “old” Union were not confirmed. Celem artykułu jest analiza przypadków kontestacji decyzji w Radzie Unii Europejskiej podczas głosowania nad aktami legislacyjnymi w zwykłej procedurze ustawodawczej, w latach 2009–2014. W pierwszym kroku postawiono dwie hipotezy badawcze. Pierwsza zakładała dominację kultury koalicyjności w głosowaniach, druga zaś odwrotnie – dominację kultury konsensusu. Dodatkowo postawiono dwie hipotezy zakładające istnienie konfliktów w Unii Europejskiej między państwami północy i południa oraz „starej” i „nowej” Unii. W celu weryfikacji hipotez zastosowano technikę skalowania wielowymiarowego. Analiza empiryczna wykazała, że dominującą kulturą głosowania jest kultura konsensusu. Pomimo tego, kilka państw zdecydowanie podkreślało swoje odrębne stanowiska, próbując tworzyć koalicje kontestujące. Ponadto nie potwierdzono hipotezy zakładającej istnienie konfliktów między państwami z północy i południa Europy oraz z „nowej” i „starej” Unii.
Visualization of multidimensional data is a new way of statistical analysis of so-called statistical graphical methods. These methods allow to classify some analyzed objects, including their various features. Facing grained materials problems, like coal or ores many characteristics have an influence on the quality of product. In case of coal, many features must be taken into consideration to determine quality of the material. Apart from most obvious characteristics like particle size, particle density or ash contents there are many others which cause significant differences between considered types of material. In the paper the application of Multidimensional Scaling Method is presented which is one of the multidimensional data visualization techniques. To this purpose, sampling of three types of coal was performed, which were 31, 34.2 and 35 (according to Polish classification of coal types). First, the material was screened on sieves and then divided into density fractions. Next step was to analyze chemically the obtained particle and size fractions of researched coal. Then, the Multidimensional Scaling Method was applied to visualize the investigated set of data. It was proved that the applied methodology allows to identify certain coal types efficiently and can be used as a qualitative criterion for grained materials. However, it was impossible to achieve such identification comparing all three types of coal together. The Multidimensional Scaling Method is new technique of data analysis concerning widely understood mineral processing.
PL
Surowce mineralne, które podlegają wzbogacaniu w celu ich lepszego wykorzystania mogą być charakteryzowane wieloma wskaźnikami opisującymi ich, interesujące przeróbkarza, cechy. Podstawowymi cechami są wielkość ziaren oraz ich gęstość, które decydują o przebiegu rozdziału zbiorów ziaren (nadaw) i efektach takiego rozdziału. Rozdział prowadzi się z reguły, w celu uzyskania produktów o zróżnicowanych wartościach średnich wybranej cechy, która zwykle charakteryzowana jest zawartością określonego składnika surowca wyznaczoną na drodze analiz chemicznych. Takie podejście do surowca mineralnego prowadzi do potraktowania go jako wielowymiarowego wektora X = [X1, …, Xn]. Zasadniczym problemem jest także wybór jednostki populacji generalnej (ziarno, jednostka objętości lub masy), co może decydować o określeniu charakteru wielowymiarowych powiązań cech wektora X. Takimi kierunkami charakteryzowania mogą być wielowymiarowe rozkłady wektora losowego X wraz ze wszystkimi konsekwencjami metody (Lyman, 1993; Niedoba, 2009; 2011; Olejnik et al., 2010; Niedoba i Surowiak, 2012), wielowymiarowe równania regresji wraz z analizą macierzy współczynników korelacji liniowej oraz korelacji cząstkowej (Niedoba, 2013c), analiza czynnikowa (Tumidajski i Saramak, 2009), czy metody wielowymiarowej wizualizacji danych, będące tematem niniejszego artykułu. Biorąc pod uwagę analizę korelacji pomiędzy badanymi cechami materiałów uziarnionych (węgli) można zidentyfikować jakie jego cechy są ze sobą istotnie powiązane. Jest to swoiste preludium do wytypowania, które cechy węgla powodują istotne różnice pomiędzy jego typami. W artykule poddano badaniu trzy typy węgla, według polskiej klasyfikacji - węgle 31, 34.2 oraz 35, pochodzące z trzech różnych kopalni Górnośląskiego Okręgu Przemysłowego. Można powiedzieć, że z punktu widzenia ich jakości były to węgle energetyczne, semi-koksujące oraz koksujące. Każdy z tych węgli został poddany podziałowi na klasy ziarnowe, przy zastosowaniu odpowiedniego zestawu sit. Następnie każdą z otrzymanych klas ziarnowych rozdzielono w cieczach ciężkich na frakcje densymetryczne. Tak otrzymane klaso-frakcje zostały dodatkowo poddane analizie chemicznej ze względu na szereg cech, tj. ciepło spalania, zawartość siarki, zawartość substancji lotnych, zawartość popiołu, miąższość. Wyniki analiz dla wybranej klasy ziarnowej przedstawiono w tabeli 1. Tym samym otrzymano siedmiowymiarowy zestaw danych, który postanowiono poddać wielowymiarowej wizualizacji za pomocą metody skalowania wielowymiarowego. Metoda skalowania wielowymiarowego (multidimensional scaling, MDS) jest jedną z nowoczesnych metod wizualizacji danych. Tego typu metody są wskazane zwłaszcza w sytuacji gdy ma się do czynienia z zestawem skomplikowanych i złożonych danych. Skalowanie wielowymiarowe jest odwzorowaniem przestrzeni n-wymiarowej w przestrzeń m-wymiarową. Oparte jest na obliczaniu odległości pomiędzy każdą parą n-wymiarowych punktów. Na podstawie tych odległości rozważana metoda ustala wzajemne położenie obrazów tych punktów w docelowej przestrzeni m-wymiarowej. Niech dij oznacza odległość pomiędzy n-wymiarowymi punktami nr i oraz j. Skalowanie wielowymiarowe polega na takim rozmieszczeniu punktów w przestrzeni m-wymiarowej, by odległość Dij liczona w tej przestrzeni pomiędzy odwzorowanymi punktami nr i oraz j była jak najbardziej zbliżona do dij. Rozdział 4 zawiera wyniki eksperymentów. Na rysunkach 1-4 widać, w jaki sposób wzrasta grupowanie punktów reprezentujących trzy różne klasy węgla (31, 34.2 oraz 35) wraz ze wzrostem parametru ITER. Widać, że punkty będące obrazami danych reprezentujących te same klasy węgla zaczynają zajmować osobne podobszary oraz zaczynają się grupować. Czytelność podziału przestrzeni rośnie wraz ze zwiększeniem parametru ITER, więc wraz z dokładniejszym dopasowaniem odległości obrazów punktów Dij w przestrzeni 2-wymiarowej do oryginalnych odległości dij pomiędzy punktami w przestrzeni n-wymiarowej. Na rysunku 4 pokazano najbardziej czytelny wynik, jaki udało się uzyskać dla danych zawierających trzy typy węgla 31, 34.2 oraz 35. Nastąpiło to przy parametrze ITER = 793. Widać wyraźnie, że obrazy punktów danych reprezentujących próbki węgla danego typu gromadzą się w skupiskach. Można zaobserwować, że na prawie całym obszarze rysunku, skupiska te można od siebie odseparować. Jednak w niektórych częściach przestrzeni obrazy punktów reprezentujących różne klasy węgla zachodzą na siebie. Przez to nie możemy na podstawie tego rysunku stwierdzić, że analizowane dane pozwalają na prawidłową klasyfikację typów węgla. Postanowiono więc przeanalizować dane reprezentujące różne typy węgla parami. Na rysunkach 5-7 przedstawiono parami węgle typu, odpowiednio, 34.2 i 35 (Rys. 5), 31 i 34.2 (Rys. 6) oraz 31 i 35 (Rys. 7). Na każdym z tych rysunków widać czytelnie, że obrazy punktów reprezentujących próbki różnych typów węgla gromadzą się w skupiskach, które łatwo można od siebie odseparować. Przeprowadzona wizualizacja wielowymiarowa przy użyciu skalowania wielowymiarowego pozwala więc stwierdzić, że informacje zawarte w analizowanych siedmiowymiarowych danych są wystarczające do prawidłowej klasyfikacji typów węgla 31, 34.2 oraz 35.
W pracy przeprowadzono analizę preferencji polskich konsumentów oleju rzepakowego z wykorzystaniem metod wielowymiarowych. Zwrócono uwagę na zbieżności i różnice zastosowania skalowania wielowymiarowego, analizy skupień i analizy PROFIT. Wykazano, że decyzje zakupowe konsumentów olejów rzepakowych w zależności od fazy życia respondentów różnią się pod względem postrzegania smaku tego oleju, jego ceny, naturalności i dotychczasowego doświadczenia.
EN
In the paper the use of multivariate methods in the analysis of consumer preferences was presented. The convergences and differences of the multidimensional scaling to cluster analysis and PRPFIT method were shown. As an example of using those methods were the results of a survey about the consumption of rapeseed oil in Poland. In a result of this research it has been shown that purchasing decisions consumers were varied, especially in terms of consumers' perception of the taste of rapeseed oil, its naturalness and price and previous experience in its consumption.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.