Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 10

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  exploratory data analysis
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The present introductory course of lectures summarizes the principles and algorithms of several widely used multivariate statistical methods: cluster analysis, principal components analysis, principal components regression, N-way principal components analysis, partial least squares regression and self-organizing maps with respect to their possible application in intelligent analysis, classification, modelling and interpretation to environmental monitoring data. The target group of possible users is master program students (environmental chemistry, analytical chemistry, environmental modelling and risk assessment etc.).
EN
The paper indicates the significance of the problem of foundry processes parameters stability supervision and assessment. The parameters, which can be effectively tracked and analysed using dedicated computer systems for data acquisition and exploration (Acquisition and Data Mining systems, A&D systems) were pointed out. The state of research and methods of solving production problems with the help of computational intelligence systems (Computational Intelligence, CI) were characterised. The research part shows capabilities of an original A&DM system in the aspect of selected analyses of recorded data for cast defects (effect) forecast on the example of a chosen iron foundry. Implementation tests and analyses were performed based on selected assortments for grey and nodular cast iron grades (castings with 50 kg maximum weight, casting on automatic moulding lines for disposable green sand moulds). Validation tests results, applied methods and algorithms (the original system’s operation in real production conditions) confirmed the effectiveness of the assumptions and application of the methods described. Usability, as well as benefits of using A&DM systems in foundries are measurable and lead to stabilisation of production conditions in particular sections included in the area of use of these systems, and as a result to improvement of casting quality and reduction of defect number.
EN
The article considers the problem of classification based on the given examples of classes. As a feature vector, a complete characteristic of object is assumed. The peculiarity of the problem being solved is that the number of examples of the class may be less than the dimension of the feature vector, and also most of the coordinates of the feature vector can be correlated. As a consequence, the feature covariance matrix calculated for the cluster of examples may be singular or ill-conditioned. This disenable a direct use of metrics based on this covariance matrix. The article presents a regularization method involving the additional use of statistical properties of the environment.
PL
W artykule rozpatrywany jest problem klasyfikacji na podstawie wskazanych przykładów klas. Jako wektor cech przyjmuje się kompletną charakterystykę obiektów. Osobliwość rozwiązywanego zadania wynika z tego, że liczba przykładów klasy może być mniejsza od wymiaru wektora cech, a także wektor cech może zawierać współrzędne skorelowane. W konsekwencji macierz kowariancji cech obliczana dla klastra przykładów może być osobliwa albo źle uwarunkowana. Uniemożliwia to bezpośrednie stosowanie metryk bazujących na tej macierzy kowariancji. W artykule została przedstawiona metoda regularyzacji polegająca na dodatkowym wykorzystaniu statystycznych właściwości środowiska.
PL
Rozpatrywany jest problem wykrywania anomalii na podstawie zarejestrowanych obserwacji zachowania systemu. Problem jest sformułowany jako zadanie rozpoznawania wzorców zachowania normalnego i zachowania nietypowego. Obydwa wzorce są określane przez wskazanie odpowiednich przykładów. Osobliwość rozwiązywanego zadania wynika z faktu, że zwykle liczebność przykładów jest dużo mniejsza od wymiaru wektora obserwacji. W artykule zostały przedstawione dwie metody detekcji anomalii bazujące na wyznaczaniu rzutów obserwacji na podprzestrzenie wzorców. Wyróżnikiem pierwszej metody jest wykorzystywanie odległości wektora obserwacji od podprzestrzeni wzorców. Druga metoda polega na przeniesieniu zadania rozpoznawania wzorców do podprzestrzeni wzorców.
EN
The paper considers the issue of anomalies detection based on registered observations of a system behavior. The problem is formulated as recognition of normal and anomalous behavior patterns. Both types of patterns are identified by indication of appropriate examples. A peculiarity of this task is that usually the number of examples is far lower than the dimension of vectors describing the observations. Two methods to solve this task have been presented in the paper, based on projecting the observations on the subspace of examples. The first method is based on a distance of the observation vector from the subspace of examples. The second method is based on transferring the pattern recognition problem to the subspace of examples.
PL
Wszystkie kategorie procesów informacyjno-decyzyjnych, realizowanych w obszarze przedsięwzięć inżynieryjnych, wymagają gromadzenia i przetwarzania znacznych ilości danych. Systemy baz danych, eksploatowane w obszarze tych przedsięwzięć, wykorzystuje się niemal wyłącznie do bieżącego przetwarzania informacji. Ich wykorzystanie do celów analitycznych ogranicza się do analiz całkowicie sterowanych przez użytkownika (inżyniera). Natomiast, w wielu obszarach zarządzania, w przechowywanych zasobach danych dostrzega się ogromny potencjał analityczny i dokonuje się z powodzeniem ich zautomatyzowanej eksploracji, pozyskując w ten sposób nową wiedzę (odkrywając nietrywialne, nieznane wcześniej prawidłowości). Wydaje się, że nie ma przeszkód, by podobne działania realizować także w obszarze przedsięwzięć inżynieryjnych, odkrywając nowe klasyfikacje, asocjacje, czy identyfikując sekwencje zdarzeń. Zautomatyzowana eksploracja danych często okazuje się jedynym sposobem wyszukiwania prawidłowości w ogromnych zbiorach danych, których człowiek nie jest w stanie przeanalizować. Specyfika przedsięwzięć inżynieryjnych (znaczna złożoność, niejednorodność a często także niepowtarzalność sytuacji problemowych) narzuca przy tym określone ograniczenia na poszczególne etapy takiej analizy. W opracowaniu przybliżono uwarunkowania stosowania eksploracyjnej analizy danych w przedsięwzięciach inżynieryjnych, nakreślono zakres przedsięwzięć niezbędnych do wykonania w poszczególnych jej etapach oraz wskazano narzędzia umożliwiające programową realizację tego typu przedsięwzięć.
EN
In all categories of information-based decision-making processes implemented in the area of engineering, a significant amount of data must be gathered and processed. Parameters of engineering equipment, as well as data gathered, inter alia, during analysis, design and construction of engineering objects or systems for monitoring engineering structures are stored mainly in operational databases. Database systems utilized in the area of engineering are used almost exclusively for ongoing information processing. Their use for analytical purposes is limited to analyses entirely directed by the user (engineer). On the other hand, in many areas of management, pools of stored data are valued for their immense analytical potential, and their automated exploration is successfully conducted, yielding new knowledge (bringing out extraordinary, hitherto unknown regularities). There is no reason to believe that such activities would not be feasible also in the area of engineering, where they would produce discoveries of new classifications, associations, or identification of sequences of events. Automated exploration of data often turns out to be the only way of looking for regularities in pools of data which are too large for a human being to analyze. The character of engineering projects (their high complexity, heterogeneity, and often the uniqueness of the problem situation) imposes specific restrictions on each phase of such analysis. This study explains conditions for use of exploratory data analysis in engineering projects, delineates the scope of activities which have to be undertaken on its consecutive stages, and presents tools enabling programmatic completion of such projects.
EN
In order to identify the modal parameters of civil structures it is vital to distinguish the defective data from that of appropriate and accurate data. The defects in data may be due to various reasons like defects in the data collection, malfunctioning of sensors, etc. For this purpose Exploratory Data Analysis (EDA) was engaged to envisage the distribution of sensor’s data and to detect the malfunctioning with in the sensors. Then outlier analysis was performed to remove those data points which may disrupt the accurate data analysis. Then Data Driven Stochastic Sub-space Identification (DATA-SSI) was engaged to perform the modal parameter identification. In the end to validate the accuracy of the proposed method stabilization diagrams were plotted. Sutong Bridge, one of the largest span cable stayed bridge was used as a case study and the suggested technique was employed. The results obtained after employing the above mentioned techniques are very valuable, accurate and effective.
PL
Jako, że infrastruktura lądowa, a w szczególności mosty o długich przęsłach, ulega z czasem starzeniu, wzrasta również istotność jej zrównoważonej ekonomicznie konserwacji. Ze względu na fakt, że tradycyjne techniki oględzin są zarówno czasochłonne, jak i kosztowne, konieczne jest opracowanie bardziej wiarygodnego i skutecznego systemu monitorowania mostów o długich przęsłach w celu ciągłego monitorowania zachowania się konstrukcji na podstawie szybkiej i dokładnej analizy danych. Ponieważ system monitorowania wykazuje anomalie w wyniku wadliwego funkcjonowania czujników lub awarii systemu, konieczne jest opracowanie efektywnej i skutecznej techniki, która umożliwi szybkie wykrywanie takich anomalii oraz prezentowanie ich w sposób bardziej profesjonalny. Dlatego w niniejszym opracowaniu przedstawiono metodę Eksploracyjnej Analizy Danych (EAD). Od kilkudziesięciu lat, wyznaczanie parametrów modalnych odgrywa coraz większą rolę, ponieważ dostarcza innowacyjnych narzędzi, umożliwiających zrozumienie i kontrolowanie optymalizacji projektu oraz oceny wytrzymałości konstrukcyjnej obiektu. Istnieje szereg technik SSI, takich, jak Covariance Driven SSI, Data Driven (DATA-SSI), jak również kombinacje innych metod, takich, jak techniki SSI Expectation Maximization (EM-SSI) czy Empirical Mode Decomposition (EMD). Niniejsze opracowanie opisuje zastosowanie techniki DATA-SSI z pewnymi ulepszeniami w odniesieniu do faktycznie istniejącego mostu o długich przęsłach. W przypadku danych gromadzonych na dużą skalę, zrozumienie zestawów danych zawierających cokolwiek więcej, niż tylko szereg punktów danych bez zastosowania efektywnej techniki jest praktycznie niemożliwe. Ponieważ dane gromadzone w trakcie monitorowania stanu mostów mają z reguły ogromną objętość, a niewiele wiadomo na temat funkcji gęstości prawdopodobieństwa (PDF), zawsze zaleca się, aby inżynier przeanalizował dane w celu określenia i wskazania najważniejszych cech danych, zanim zastosuje techniki ilościowe; podstawową przeszkodą dla inżyniera jest w tym wypadku czas. EDA to najpotężniejsze narzędzie, wspomagające eksplorowanie „wewnętrznych sekretów” danych w sposób szczegółowy przy znacznym ograniczeniu czasu trwania obliczeń. Eksploracyjny charakter EDA może okazać się wystarczający dla wielu zastosowań SHM. Jakkolwiek istnieje wiele technik graficznej reprezentacji danych, w niniejszym opracowaniu omówimy zaledwie kilka z nich, aby zilustrować dokładność i skuteczność EDA – takie, jak wykresy kontrolne, krzywe Andrewsa oraz histogramy. W przypadku faktycznie istniejących konstrukcji lądowych na wielką skalę, w danych zawsze pojawiają się szumy i zniekształcenia; zasadniczo, nie istnieją z góry zdefiniowane informacje na temat liczby modułów podlegających przetworzeniu. Podstawową przyczyną tego stanu rzeczy są niepewności związane z określeniem rzędu układu. Dlatego używa się diagramu stabilizacji w celu rozróżnienia pomiędzy szumami lub fałszywymi biegunami a prawdziwymi biegunami układu. Diagram stabilizacji jest de facto rysunkową ilustracją występowania biegunów przy tej samej częstotliwości w wyniku zwiększania rzędu modelu modalnego w celu przedstawienia stanu fizycznego rzędu układu. Na podstawie procedury DATA-SSI, diagram stabilizacji wykreślono dla danych otrzymanych dla mostu Sutong. Most Sutong jest to most nad rzeką Jangcy i jeden z najdłuższych mostów wantowych, łączący Changshu i Nantong. Jest to most o siedmiu przęsłach, dwupylonowy, wantowy, w formie stalowej konstrukcji skrzynkowej o rozpiętości najdłuższego przęsła wynoszącej 1088m, przy czym łączna długość mostu wynosi: 100+100+300+1088+300+ 100+100=2088m. Aby wyznaczyć parametry modalne mostu Sutong, pobrano dane z 14 czujników – akcelerometrów, zainstalowanych na moście. Ogromna ilość danych, pobranych z systemu SHM na moście Sutong, została w pierwszej kolejności poddana wizualizacji przy pomocy EDA, aby określić najważniejsze tendencje oraz trendy w danych, ponieważ reprezentacja graficzna danych jest szybka i dokładna oraz umożliwia ogromną oszczędność czasu w porównaniu z technikami obliczeniowymi. Następnie przeprowadzono analizę odchyleń w celu odrzucenia ze zbioru danych budzących wątpliwości. Następnie wprowadzono technikę DATA-SSI, zapewniającą większą niezawodność i stabilność wyników. Na podstawie DATA-SSI określono parametry modalne, takie, jak częstotliwość czy wartość tłumienia, a wyniki wskazują, że proponowana metoda znakomicie broni się merytorycznie. Następnie sporządzono diagram stabilizacji, aby zweryfikować stwierdzony wstępnie prymat metody. Wyniki, pozyskane za pomocą wyżej wymienionych technik, są nie tylko autentyczne, ale też niezwykle efektywne, co sugeruje możliwość znaczącej poprawy rezultatów monitoringu, prowadzonego w terenie.
7
Content available remote Failure duration in distribution networks
EN
The paper deals with statistical analysis of data on faults and failures in electrical power distribution. We used the statistical analysis of both MV overhead and cable lines, and electrical power stations of one distribution company. The data were collected from 2000 to 2009 with focus on the duration of failure with respect to different types of equipment. To compare and analyze the data, we used confidence intervals and also statistical distribution of data-sets.
PL
W artykule analizowano dane statystyczne błędów i defektów w przesyle energii elektrycznej. Wykorzystano dane linii średniego napięcia kablowych i napowietrznych. Dane były zebrane w latach 2000 do 2009.
PL
W analizie rynku nieruchomości możliwe jest zastosowanie narzędzi Eksploracyjnej Analizy Danych (ang. exploratory data analysis), do których należy między innymi grupowanie mające na celu utworzenie zbiorów elementów w jakimś sensie do siebie podobnych. Metody te są stosowane do wykrywania struktury zebranych danych lub dokonywania uogólnień np. w wyszukiwaniu informacji oraz analizie obrazu. Wraz z zastosowaniem grupowania, czyli klasyfikacji bezwzorcowej tworzy się grupa klas, którą można określić jako zbiór obiektów, w którym podobieństwo pomiędzy dowolną parą obiektów jest większe niż podobieństwo pomiędzy dowolnym obiektem należącym do klasy, a dowolnym obiektem, który do niej nie należy. W niniejszym opracowaniu przedstawiono zastosowanie metody grupowania k-średnich nieruchomości lokalowych o podobnych cechach mających wpływ na wartość tych nieruchomości na terenie małych miast. W procedurze tej pod uwagę zostały wzięte takie cechy nieruchomości jak: piętro, powierzchnia mieszkania, rok budowy, czas dojazdu do centrum miasta oraz standard mieszkania. Opracowane podejście wyodrębni grupy nieruchomości o podobnych cechach i pozwoli zaobserwować ich ceny w zależności od konkretnych własności lokali. Dobrana metoda grupowania będzie stanowić element kartograficznego modelowania cen nieruchomości lokalowych prowadzącego do opracowania mapy wartości nieruchomości za pomocą metod geostatystycznych. Powyższa procedura w znaczący sposób może wpłynąć na jakość i efektywność zarządzania zasobami nieruchomości oraz ułatwić podejmowanie decyzji dotyczących gospodarowania nieruchomościami.
EN
In the analysis of the real property market it is possible to use Exploratory Data Analysis Tools which include, inter alia, grouping whose aim is to create sets of items that are similar to each other to a certain extent. The said methods are applied for the purposes of indentifying the structure of the collected data as well as in order to make generalisations, e.g. in image analysis or searching for information. With the use of the clustering method, that is non-model classification, a group of classes is created which can be defined as a set of objects in which similarity between any pair of objects is greater than similarity between any object belonging to the class and any object that does not belong thereto. This paper presents the application of the method of k-means clustering to assess residential properties with similar characteristics affecting the value of these properties in small towns. In the course of the procedure in question, the following property characteristics were taken into account: floor, usable floor space, year of construction, length of journey to the city centre and standard of the residential property. The developed approach will separate groups of properties with similar characteristics as well as will enable observance of their prices depending on individual characteristics of the property. The chosen grouping method will constitute an element of cartographic modelling of the prices of residential properties which will lead to the development of the map of real property values with the use of geostatistical methods. The abovementioned procedure may significantly affect the quality and efficiency of property management as well as facilitate the decision-making process concerning the management of real properties.
9
Content available remote Modelowanie rozmyte z zastosowaniem algorytmu optymalizacji rojem cząstek
PL
Głównym celem niniejszego artykułu jest opracowanie algorytmu klasteryzacyjnego opartego o inspirowany biologicznie algorytm optymalizacji rojem cząstek i dedykowanego dla zagadnienia modelowania rozmytego. W pracy omówiona została idea heurystycznego algorytmu rojowego, z uwzględnieniem wybranych jego modyfikacji. Zawarte zostały wyniki eksperymentalnej ewaluacji, zarówno wybranej techniki optymalizacji, jak i opracowanej z jej uwzględnieniem metody modelowania rozmytego, w odniesieniu do istniejącego już algorytmu k-średnich oraz realizacji procesu sterowania rozmytego.
EN
The main goal of this paper is a description of clustering algorithm based on the particle swarm optimization algorithm, inspired on social behavior of animals and its application in fuzzy modeling. In the paper the idea of the heuristic swarm-based algorithm was presented, including a few modifications. Moreover, the results of the experimental evaluation were shown, both a selected optimization technique and its synthesis with a fuzzy modeling method referring to the k-means algorithm and the fuzzy control process.
10
Content available Briefly on the GUHA method of data mining
EN
The paper gives brief, user-oriented, information on the GUHA method.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.