The article attempts to find an algebraic formula describing the correlation coefficients between random variables and the principal components representing them. As a result of the analysis, starting from selected statistics relating to individual random variables, the equivalents of these statistics relating to a set of random variables were presented in the language of linear algebra, using the concepts of vector and matrix. This made it possible, in subsequent steps, to derive the expected formula. The formula found is identical to the formula used in Factor Analysis to calculate factor loadings. The discussion showed that it is possible to apply this formula to optimize the number of principal components in Principal Component Analysis, as well as to optimize the number of factors in Factor Analysis.
This article presents a new approach to determine the model order (number of principal components) in the modified Prony method applied to swath acoustic mapping. Determination of the number of principal components is a crucial step in the modified Prony method. In the proposed approach the model order is chosen based on the underlying physical model of the underwater acoustic environment, and utilised signal processing operations. This data-driven approach, attempts to make use of all available information to assess the number of signals arriving at the receiver using pipeline processing in lieu of iterative processing.
This article presents the performance of a new approach to determine the model order for the modified Prony method applied to swath acoustic mapping. Key requirements for any mapping application are depth determination accuracy and angular resolution. Depth determination accuracy is strictly related to angular accuracy and geometrical relations between receiver and sources of the backscattered signal. Angular resolution determines detection capabilities of targets laying on the seafloor. Performance of the proposed method, in terms of these two parameters, is tested against a simulated signal in a number of generic configurations, and compared to the results of other methods applied to the same signal.
W pracy przedstawiono przykłady zastosowania wielowymiarowych metod statystycznych w badaniach widm spektroskopii emisyjnej. Krótko scharakteryzowano najistotniejsze właściwości dwóch metod, takich jak Analiza Czynnikowa (FA - Factorial Analysis) i Analiza Głównych Składowych (ang. PCA - Principal Components Analysis). Zastosowano je do analizy widm emisyjnych uzyskanych ze źródeł ciągłych i impulsowych. Stwierdzono, że obróbka widm za pomocą metod FA/PCA pozwala wyznaczyć stopień podobieństwa widm, co z kolei umożliwia określenie różnic w charakterze źródeł, których emisja jest rejestrowana. W pracy zestawiono wyniki analizy FA/PCA widm LIBS (spektroskopii emisyjnej ze wzbudzeniem laserowym) w zastosowaniu badań stratygraficznych, identyfikacji różnych gatunków papieru, analizy powierzchniowej korozji wyrobów ze stopów stali o różnej strukturze powierzchni, wyładowań w gazie i żarówek. Zaprezentowano próby zastosowania metody FA do konstrukcji krzywych kalibracyjnych, umożliwiających badania ilościowe stopów metali, bez konieczności korzystania z danych atomowych właściwych składnikom stopów.
EN
The most important characteristics of the Principal Components Analysis and Factorial Analysis are briefly described. They were applied to analysis of emission spectra obtained from stationary and pulse sources. It was stated that processing of spectra using PCA/FA methods reveals similarity level of the spectra, which in turn allows for determination of differences between analysed sources which emission is measured. Results of PCA/FA analysis of LIBS spectra applied to stratigraphy measurements, identification of paper sort, corrosion process of surface layers of iron alloys, discharges in gas and light bulbs are shown. Attempts of the use of the FA method for construction of calibration curves is presented which can be applied in quantitative measurements without need of use of atomic data.
Pokazano możliwość analizy zbioru danych numerycznych w aspekcie odkrywania niewidocznych związków pomiędzy tymi danymi. Posłużono się metodą analizy składowych głównych oraz wybranymi metodami grupowania danych. W pierwszym przykładzie przeanalizowano podobieństwo wybranych krajów UE w dziedzinie pozyskiwania przez nie energii ze źródeł odnawialnych. Posłużono się powszechnie dostępnymi danymi statystycznymi z baz Głównego Urzędu Statystycznego. W drugim przykładzie pokazano możliwość grupowania okresów zmienności notowań giełdowych. Posłużono się historycznymi (rok 1998) danymi dotyczącymi notowań wybranych indeksów giełdy amerykańskiej.
EN
In this paper we analyze some numerical data sets in order to uncover unknown or hidden relationships between them. We use principal component analysis approach as well as the hierarchical clustering method. In the first example we analyze similarities of EU countries in the field of production of energy from renewable sources. We use commonly available data from the Polish Central Statistical Office. In the second example we try to find groups of similar periods of time based on the US stock exchange. We use same historical (1998) stock exchange quotations of some selected indexes.
6
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
OBJECTIVE: Environmental exposition in the workplace of welders to free radicals and Reactive Oxygen Species (ROS) is multifactor and the response of their organisms to this exposition may be complex. This is why a wide range of clinical, biochemical and spirometrical measurements are performed to reveal early abnormalities in welders’ health status. In order to estimate the relations between obtained results of examinations and to reduce the dimensionality of the relatively large set of data, two methods have been used: 1. Pattern recognition methods: principal components analysis (PCA) and mutual contributions analysis (MCA). 2. Artificial Neural Networks (ANNs). METHODS: There were 94 welders employed in Huta Sendzimira in Kraków, Poland (men only, aged 29–57, all active smokers) occupationally exposed to O3 and NOx under examination. They underwent biochemical measurements including: Total Antioxidant Status (TAS) and anti-oxidative defense enzymes level: Superoxide Dismutase (SOD) and Catalase (CT); biomineral levels: Fe, Cu, Zn, Mg in blood serum and in hair, the concentrations of albumins, bilirubin and uric acid in blood. The determination of respiratory efficiency was based on a “flow-volume” curve and spirometry. The dependent variables for ANNs were: TAS, SOD, and CT. RESULTS: Both methods were useful for reduction of the dimensionality and were suitable for complex analysis and relatively large set of parameters when it was unknown which of these parameters were related. PCA showed that the most relevant parameters were: FEV1, MEF50, bilirubine, Fe, Zn, Cu (all elements in blood, not in hair) TAS and SOD. Only the relations of MEF50, Cu and TAS were statistically valid. ANNs found statistically valid relationship between TAS and Zn and Cu in blood and two pulmonary parameters: FEV 1 and MEF 25/75. CONCLUSIONS: Both methods proved the existence of less known relation between antioxidant defense and the efficiency of the respiratory tract in smoking welders. This relation is important for occupational medicine.
PL
Źródło ekspozycji na wolne rodniki i reaktywne pochodne tlenu w środowisku pracy spawaczy jest wieloczynnikowe, a odpowiedź organizmu na tę ekspozycję może być ogólnoustrojowa. W związku z tym dla określenia charakteru i stopnia natężenia tej odpowiedzi wykonywany jest szeroki zakres badań klinicznych, biochemicznych i laboratoryjnych. Uzyskane z badań diagnostycznych wyniki wykazują różny stopień wzajemnych zależności. W celu uściślenia relacji między nimi oraz wyselekcjonowania parametrów istotnie ze sobą powiązanych zastosowane mogą być 2 metody: 1. PCA (Principal Components Analysis) – Analiza Składowych Głównych i MCA (Mutual Contributions Analysis) – Analiza Wzajemnych Udziałów. 2. Sztuczne Sieci Neuronowe (ANNs). Badaniami objęto 94 spawaczy w wieku 29-57 lat zatrudnionych w Hucie im. T. Sendzimira w Krakowie. Wszyscy badani mężczyźni byli palaczami papierosów, a w miejscu pracy byli wystawieni na działanie ozonu i tlenków azotu w stężeniu przekraczającym NDS. W ramach badań okresowych mieli wykonane pomiary równowagi oksydacyjno- antyoksydacyjnej, obejmujące całkowitą wydolność antyoksydacyjną (TAS) i aktywność enzymów: dysmutazy ponadtlenkowej (SOD) i katalazy (CT); oznaczenia stężeń składników mineralnych: Fe, Cu, Zn, Mg w krwi i we włosach oraz oznaczenia stężeń albuminy, bilirubiny i kwasu moczowego we krwi. Oznaczono również parametry określające wydolność układu oddechowego, które uzyskano z krzywej „Przepływ- objętość ” i spirometrii. Zmiennymi zależnymi dla ANNs były TAS, SOD, CT. Obie metody okazały się użyteczne w redukcji rozproszenia rezultatów uzyskanych z badań diagnostycznych. Były również przydatne w kompleksowej analizie dużej liczby wyników, a jednocześnie w uściśleniu tych relacji, które są ważne z medycznego punktu widzenia. Metoda PCA wykazała, że najistotniejszymi parametrami były: TAS i SOD, bilirubina, Fe, Zn, Cu (oznaczane we krwi, a nie we włosach) oraz FEV1, MEF50. Tylko relacja między MEF50, Cu i TAS była istotna statystycznie. Metodą sieci neuronowych uzyskano istotny związek między TAS oraz Zn i Cu we krwi i dwoma parametrami wentylacyjnymi: FEV1 i MEF25/75. Przy użyciu obu metod udowodniono mniej znany związek między wydolnością antyoksydacyjną i sprawnością wentylacyjną układu oddechowego spawaczy będących czynnymi palaczami tytoniu. Znajomość tych relacji jest ważna dla lekarzy medycyny przemysłowej.
The purpose of this paper is to determine one factor which represents the whole market behavior on the basis of the rates of return of all equities traded oo this market. In the seminaal Sharpe model the factor is an exogenous varialble which is not determined by the model itself. This paper extends Sharpe's idea, as it assumes that the factor is a linear combination of all the rates of return of all traded equities. To determine this coefiicients of this linear combination we minimize the loss function which expresses the weighted mean square deviation of all rates of return from their predictions, having given the linear combination form of the market index. It is found that the vector of linear coeffcients has to be a nonzero eigenvector associated with the maximal eigenvalue of the appropriately transformed and estimated covariance matrix. The optimal market index for the Warsaw Stock Exchange was compared with the standard index. It occurs that there is only a very small difference between the standard index of this market and the optimal index.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.