Wyniki wyszukiwania - BazTech

1

The possibilities of visualisation multidimensional databases in interactive visual communication

Rybak Łukasz, Bednarski Radosław

Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne

|

2023

|

nr 5

22--27

EN

In the article, we describe the possibilities of presenting multidimensional data warehouses in interactive two dimensional visualizations. We show how to avoid the information overload problem. This is a complex and difficult issue because each set describes different data. Therefore, there are no universal methods that can be transferred between visualizations of different databases. In this article, we analyze the graphical resources of available two-dimensional data visualizations. We describe the possibilities of their binding to specific types of data. In addition, we present their use for a specific data set described by thirteen features. In order to check the correctness of our analysis, we conduct scenario tests of usability.

PL

W artykule opisujemy możliwości prezentacji wielowymiarowych hurtowni danych w interaktywnych wizualizacjach dwuwymiarowych. Pokazujemy, jak uniknąć problemu redundancji informacji. Jest to zagadnienie złożone i trudne, gdyż każdy zbiór opisuje inne dane. Dlatego nie ma uniwersalnych metod, które można przenosić pomiędzy wizualizacjami różnych baz danych. W artykule analizujemy zasoby graficzne dostępnych dwuwymiarowych wizualizacji danych. Opisujemy możliwości ich powiązania z określonymi typami danych. Dodatkowo prezentujemy ich zastosowanie dla konkretnego zbioru danych opisanego przez trzynaście cech. W celu sprawdzenia poprawności naszej analizy przeprowadzamy scenariuszowe testy użyteczności.

2

A principal component analysis of multivariate data on inflation for Nigeria

Omoregie David E., Ekhosuehi Virtue U.

Mathematica Applicanda

|

2020

|

Vol. 48, no. 2

115--132

EN

For quite some time now, the Central Bank of Nigeria (CBN) analyses multivariate data on inflation so as to account for diverse sources of inflationary pressures at the current period and to monitor the inflation pattern in the economy. When the data are subjected to the classical multiple regression analysis using the Ordinary Least Squares (OLS) method, some of the variables may be highly correlated causing statistical insignificance. This may lead to exclusion of some variables from the fitted model. When this happens, the cost of data collection for such variables is a waste. Regardless of the outcome from a variable selection technique, this study is designed to familiarise monetary policy makers with the possibility of integrating Principal Component Analysis (PCA) with the regression analysis so that a few variable components are utilised without excluding any explanatory variable. The paper models the multivariate data at the CBN database on inflation, and extracts important artificial orthogonal variables from the linear combinations of the observed explanatory variables, although with a penalty cost of excluding components with observations that are minimally separated. The PC-based model explains 95.91% of variations in the headline inflation with a mean difference (between the actual and the predicted inflation) that is statistically not different from zero. The study is a significant addition to the existing methodologies for inflation forecasting in the literature as it is one of a few works that apply PCA-based technique to predict headline inflation.

PL

Centralny Bank Nigerii (CBN) od dłuższego czasu analizuje wielowymiarowe dane o inflacji, aby uwzględnić różne źródła presji inflacyjnej w bieżącym okresie i monitorować kształtowanie się inflacji w gospodarce. Gdy dane są poddawane klasycznej analizie regresji wielorakiej przy użyciu zwykłej metody najmniejszych kwadratów (OLS), to niektóre zmienne mogą być silnie skorelowane, co powoduje brak nieistotność statystycznej modelu. Może to prowadzić do wykluczenia niektórych zmiennych z dopasowanego modelu. W takim przypadku koszt gromadzenia danych dla takich zmiennych jest stratą. Niezależnie od wyniku techniki selekcji zmiennych, niniejsze badanie ma na celu zaznajomienie decydentów polityki pieniężnej z możliwością zintegrowania analizy składowych głównych (PCA) z analizą regresji, tak aby można było wykorzystać kilka zmiennych składowych bez wykluczania żadnej zmiennej wyjaśniającej. Artykuł modeluje dane wielowymiarowe w bazie danych CBN na temat inflacji i wyodrębnia ważne sztuczne zmienne ortogonalne z liniowych kombinacji obserwowanych zmiennych objaśniających, chociaż z karą za wykluczenie komponentów z obserwacjami, które są minimalnie oddzielone. Model numeryczny wyjaśnia 95,91 % zmienność zasadniczej inflacji przy średniej różnicy (między rzeczywistą i przewidywaną inflacją), która nie jest statystycznie różna od zera. Badanie jest istotnym uzupełnieniem istniejących w literaturze metodologii prognozowania inflacji, ponieważ jest jedną z nielicznych prac, które wykorzystują technikę PCA do przewidywania inflacji zasadniczej.

3

Multidimensional data collection structures and logistic data analysis in TAGIS system

Gabara G., Pomiankowska-Wronka A.

Logistyka

|

2015

|

nr 4

3278--3287, CD2

EN

In this paper there are introduced the principles of multidimensional data collecting structures in advanced technological GIS system - TAGIS. Attention is paid to the format of data and possibility of collecting data for analysis . The focus of the second part is how to collect data concerning the existing railway infrastructure and analyze those data for illustrate the possibilities of GIS systems in logistics. There are also discussed usage of mobile devices in logistics problems like: localization of transport downtimes and localization of vulnerable places to external factors that may lead to delays in rail transport.

PL

W artykule opisano opracowanie struktur gromadzenia danych w zaawansowanym Systemie Informacji Przestrzennej TAGIS. Zwrócono uwagę jakie dane oraz w jakim formacie mogą być pozyskane w celach analiz. W drugiej części artykułu wykazano w jaki sposób można gromadzić dane dotyczące wykorzystania istniejącej infrastruktury kolejowej oraz przeprowadzono analizę takich danych w celu zobrazowania możliwości wykorzystania Systemów Informacji Przestrzennej w transporcie. Poddano rozważaniom stosowanie urządzeń mobilnych w celu lokalizacji przestojów transportowych oraz lokalizacji miejsc podatnych na czynniki zewnętrzne mogące prowadzić do opóźnień w transporcie kolejowym.

4

Optimization of the maximum likelihood estimator for determining the intrinsic dimensionality of high-dimensional data

Karbauskaitė R., Dzemyda G.

International Journal of Applied Mathematics and Computer Science

|

2015

|

Vol. 25, no. 4

895--913

EN

One of the problems in the analysis of the set of images of a moving object is to evaluate the degree of freedom of motion and the angle of rotation. Here the intrinsic dimensionality of multidimensional data, characterizing the set of images, can be used. Usually, the image may be represented by a high-dimensional point whose dimensionality depends on the number of pixels in the image. The knowledge of the intrinsic dimensionality of a data set is very useful information in exploratory data analysis, because it is possible to reduce the dimensionality of the data without losing much information. In this paper, the maximum likelihood estimator (MLE) of the intrinsic dimensionality is explored experimentally. In contrast to the previous works, the radius of a hypersphere, which covers neighbours of the analysed points, is fixed instead of the number of the nearest neighbours in the MLE. A way of choosing the radius in this method is proposed. We explore which metric—Euclidean or geodesic—must be evaluated in the MLE algorithm in order to get the true estimate of the intrinsic dimensionality. The MLE method is examined using a number of artificial and real (images) data sets.

5

Application of multidimensional data visualization by means of self-organizing Kohonen maps to evaluate classification possibilities of various coal types

Jamróz D., Niedoba T.

Archives of Mining Sciences

|

2015

|

Vol. 60, no. 1

39--50

EN

Multidimensional data visualization methods are a modern tool allowing to classify some analysed objects. In the case of grained materials e.g. coal, many characteristics have an influence on the material quality. The paper presents the possibility of applying visualization techniques for coal type identification and determination of significant differences between various types of coal. To achieve this purpose, the method of Kohonen maps was applied by means of which three types of coal – 31, 34.2 and 35 (according to Polish classification of coal types) were investigated. It was stated that the applied methodology allows to identify certain coal types efficiently and can be used as a qualitative criterion for grained materials.

PL

Metody wizualizacji wielowymiarowych danych są nowoczesnym narzędziem umożliwiającym klasyfikację analizowanych obiektów, którymi mogą być różnego typu dane opisujące wybrane zjawisko lub materiał. W przypadku materiałów uziarnionych, jakim jest np. węgiel, wiele cech ma wpływ na jakość materiału, tj. np. gęstość, wielkość ziaren, ciepło spalania, zawartość popiołu, zawartość siarki itp. Na potrzeby artykułu przeprowadzono rozdział węgli z trzech wybranych kopalni węgla kamiennego, zlokalizowanych w Górnośląskim Okręgu Przemysłowym. Każda z tych kopalni pracuje na innego typu węglu. W tym przypadku były to węgle o typach 31, 34.2 oraz 35 (według polskiej klasyfikacji typów węgla). Najpierw, materiał został podzielony na klasy ziarnowe a następnie za pomocą rozdziale w cieczy ciężkiej (roztwór chlorku cynku) na frakcje gęstościowe. Dla tak przygotowanego materiału przeprowadzono następnie analizy chemiczne mające na celu określenie takich parametrów, jak zawartość siarki, zawartość popiołu, zawartość części lotnych, ciepło spalania oraz wilgotność analityczną. W ten sposób, dla każdej klaso-frakcji uzyskano bogate charakterystyki badanego materiału. Nasuwa się więc pytanie, czy możliwa jest identyfikacja typu węgla za pomocą dostępnych danych. W tym celu zastosowano wielowymiarową technikę wizualizacji statystycznej. Istnieje wiele metod takiej wizualizacji, z których kilka było już przedmiotem wcześniejszych publikacji autorów. W tym wypadku autorzy zdecydowali się zastosować metodę sieci Kohonena. Metoda ta została opisana w rozdziale 2 pracy, gdzie oprócz opisu teoretycznego podano również główne wzory stosowane podczas modelowania tą metodą (wzory (1)-(5)). Do zbadania postawionego problemu wykorzystano optymalną liczbę iteracji i optymalny czas uczenia sieci. Pewnym problemem pojawiającym się przy takiej wizualizacji jest konieczność doboru parametrów, w celu uzyskania widoku, który w sposób czytelny prezentuje poszukiwane przez nas informacje. Należy wspomnieć, że w trakcie prowadzonych eksperymentów uzyskiwano widoki przy użyciu sieci neuronowej o wielkości od 10 × 10 do 100 × 100 neuronów. Widoki były uzyskiwane przy wartości parametru MAX_DISTANCE od 1 do wielkości sieci oraz parametru ITER od 1 do 5000. Eksperymenty były prowadzone dla różnych wzorów określających modyfikację wag. Przedstawione w pracy wyniki stanowią najbardziej czytelne z uzyskanych. Wizualizacja wielowymiarowa przy użyciu sieci Kohonena pozwala stwierdzić, że informacje zawarte w analizowanych siedmiowymiarowych danych są wystarczające do prawidłowej klasyfikacji typów węgla 31, 34.2 oraz 35, przy czym nawet zobrazowanie 3 typów węgla na jednym rysunku pozwala stwierdzić, że neurony reprezentujące próbki węgla danego typu gromadzą się w skupiskach, które można od siebie odseparować. Z tego wynika, że dane zawierają informacje wystarczające do prawidłowej klasyfikacji węgla. Zauważyć jednak warto, że przedstawienie przy pomocy sieci Kohonena, danych reprezentujących różne typy węgla parami, pozwala uzyskać jeszcze bardziej czytelne wyniki. Najlepsze efekty osiągnięto dla sieci o 40 wierszach oraz 40 kolumnach neuronów, co łącznie dało liczbę 1600 neuronów, zaś czytelność wyników rośnie wraz z postępem uczenia sieci neuronowej (wzrostem parametru ITER). Przeprowadzone doświadczenia w pełni potwierdzają, że zastosowana metoda może być z powodzeniem wykorzystana w badaniach jakościowych związanych z różnego typu materiałami uziarnionymi, w tym również węglem. Badania w tym zakresie są kontynuowane.

6

Multidimensional data visualization with the NovoSpark® Visualizer software

Pilipczuk O., Eidenzon D.

Zeszyty Naukowe. Studia Informatica / Uniwersytet Szczeciński

|

2013

|

Nr 32

49--60

EN

In this paper the authors present a method for visualization and qualitative analysis of multivariate data implemented in the NovoSpark® Visualizer software system. An application example, based on solar activity data, is discussed as well. Selected traditional methods are compared with NovoSpark method. The results of experiment prove that traditional methods of multidimensional data visualization (such as linear plots and parallel coordinates) lack the ability to simultaneously display all dimension values, static or dynamic, in a clear single image.

PL

Tradycyjne metody wielowymiarowej wizualizacji danych (takie jak macierze wykresów rozproszonych, współrzędne biegunowe, twarze Chernoffa itp.) nie pozwalają na jednoczesne wyświetlanie wszystkich wartości wymiarów statycznych lub dynamicznych w ramach jednego przejrzystego obrazu. W artykule autorzy przedstawiają metodę wizualizacji i jakościowej analizy danych wielowymiarowych w systemie NovoSpark®Visualizer. Podano przykład zastosowania systemu do analizy danych wybranych wskaźników aktywności słonecznej.

7

Diversification maps as a tool for multidimensional data presentation

Jałowiecki P., Jałowiecka E.

Information Systems in Management

|

2012

|

Vol. 1, No. 3

197--210

EN

In addition to data analysis, equally important issue, is the appropriate presentation of the analysis results during the economic, social and demographic studies. Depending on the legibility of the used form, it may make it easier or more difficult to interpret and draw conclusions. Especially difficult is the presentation of multidimensional data, according to the limitations of traditional types of graphs. The paper presents a graphical presentation of the three-dimensional data in the form of the so-called "map of differentiation" that is suitably modified spatial graph. There were presented different types of maps, layers determination ways and examples of specific applications for cigarettes consumption and diversification of logistics in the Polish food processing data.

8

The evolutionary heuristics applied to the analysis of multidimensional data

Jasińska-Suwada A.

Prace Naukowe Politechniki Warszawskiej. Elektronika

|

2006

|

z. 156

163-170

EN

This paper describes the pattern recognition system for analysis of multidimensional data, based on natural meta-heuristics. The system consists of tree modules: preprocessing, feature extraction and clustering. Feature extraction module is based on Molecular Dynamic (MD). In clustering are used two natural methods: Simulated Annealing (SA) and Taboo Search (TS). The system is used to analyze an evolving population of individuals equipped with 'genetic codes'. Clustering module extracts groups of data with similar genetic code named clusters and make of possible to observe their geographical localization. The feature extraction verifies the clustering and allows analyzing of clustering patterns, their shapes and the distances between them.

9

Autoassociative neural networks in the tasks of multivariate data visualization

Raskhevich J., Pękala R., Tkachenko R., Tsymbal Y.

Zeszyty Naukowe Politechniki Rzeszowskiej. Elektrotechnika

|

2002

|

z. 24 [200]

115-120

EN

Architecture of an two-cascade neural network for the tasks of multivariate data visualization on <> paradigm has been proposed. This architecture is characterized with fast and reliable construction of situational feature maps in the space with smaller dimension. The results of application of the architecture in the test iris plants classification task have been considered. Examples of situational feature maps for different datasets and attributes of irises have been are presented as well.

PL

W pracy przedstawiono architekturę dwuwarstwowej sieci neuronowej do realizacji zadania wizualizacji danych wielowymiarowych. Zaproponowana architektura sieci charakteryzuje się niezawodnością i dużą szybkością działania, generując sytuacyjną mapę cech w przestrzeni o zmniejszonym wymiarze. Wyniki zastosowania powyższej architektury sieci na testowym obrazie "iris" przedstawiono w części eksperymentalnej pracy.