Wyniki wyszukiwania - BazTech

1

Wykorzystanie języka R do statystycznej analizy oraz analizy skupień dla danych geochemicznych

Janiga Marek

Nafta-Gaz

|

2023

|

R. 79, nr 9

576--583

PL

W zagadnieniach geologii naftowej metody statystyczne są szeroko stosowane w petrografii, petrofizyce, geochemii, geomechanice, geofizyce wiertniczej czy sejsmice, a analiza skupień jest istotna w klasyfikacji skał – wyznaczaniu stref o pewnych własnościach, np. macierzystych lub zbiornikowych. Artykuł prezentuje użycie metod statystycznych, w tym metod analizy skupień, w procesach przetwarzania i analizy dużych zbiorów różnorodnych danych geochemicznych. Do analiz statystycznych wykorzystano literaturowe dane z analiz składu chemicznego i izotopowego gazów ziemnych. Wyniki zawierały skład chemiczny gazów ziemnych oraz skład izotopowy. Zastosowano algorytmy tzw. nienadzorowanego uczenia maszynowego do przeprowadzenia analizy skupień. Grupowania było przeprowadzone dwiema metodami: k-średnich oraz hierarchiczną. Do zobrazowania wyników grupowania metodą k-średnich można wykorzystać dwuwymiarowy wykres (funkcja fviz_cluster języka R). Wymiary na wykresie to efekt analizy głównych składowych (PCA) i są one liniową kombinacją cech (kolumn w tabeli). Wynikiem grupowania metodą hierarchiczną jest wykres nazywany dendrogramem. W artykule dodatkowo zaprezentowano wykresy pudełkowe i histogramy oraz macierz korelacji zawierającą współczynniki korelacji Pearsona. Wszystkie prace wykonano z użyciem języka programowania R. Język R, z wykorzystaniem programu RStudio, jest bardzo wygodnym i szybkim narzędziem do statystycznej analizy danych. Przy użyciu tego języka uzyskanie wymienionych powyżej wykresów, tabeli i danych jest szybkie i stosunkowo łatwe. Wyniki analiz składu gazu wydają się mało zróżnicowane. Mimo to dzięki algorytmom k-średnich i hierarchicznym możliwe było pogrupowanie danych geochemicznych na wyraźnie rozdzielne zespoły. Zarówno wartości składu izotopowego, jak i skład chemiczny pozwalają wyznaczyć grupy, które w inny sposób nie byłyby dostrzegalne.

EN

In petroleum geology, statistical methods are widely used in petrography, petrophysics, geochemistry, geomechanics, well log analysis and seismics, and cluster analysis is important for rock classification – determination of zones with certain properties, e.g., source or reservoir. This paper presents the use of the R language for statistical analysis, including cluster analysis, of large sets of diverse geochemical data. Literature data from analyses of chemical and isotopic composition of natural gases were used for statistical analyses. The results included the chemical composition of the natural gases and the isotopic composition. So-called unsupervised machine learning algorithms were used to perform the cluster analysis. Clustering was performed using two methods: k-means and hierarchical. A two-dimensional graph (function fviz_cluster) can be used to illustrate the results of the k-means clustering. The dimensions in the graph are the result of principal component analysis (PCA) and are a linear combination of the features (columns in the table). The result of hierarchical clustering is a graph called a dendrogram. The paper additionally presents box plots and histograms as well as a correlation matrix containing Pearson correlation coefficients. All work was completed using the programming language R. The R language, using the RStudio software, is a very convenient and fast tool for statistical data analysis. Obtaining the above-mentioned graphs, tables and data is quick and relatively easy, using the R language. The results of the analyses of the composition of the gas appear to have little variation. Nevertheless, thanks to k-means and hierarchical algorithms, it was possible to group the geochemical data into clearly separable groups. Both the isotopic composition values and the chemical composition make it possible to delineate groups that would not otherwise be noticeable.

2

Optymalizacja struktury systemu dystrybucji przesyłek w wybranej firmie logistycznej

Tarapata Zbigniew, Antkiewicz Ryszard, Pierzchała Dariusz, Dudziński Jarosław

Prace Naukowe Politechniki Warszawskiej. Transport

|

2019

|

z. 126

137--148

PL

W artykule przedstawiono opis, sformułowanie oraz metodę rozwiązania pewnego problemu optymalizacji struktury systemu dystrybucji przesyłek w wybranej firmie logistycznej. Założono, że przesyłki generowane są w obszarach kodów adresowych (precyzyjniej: znamy wolumen przesyłek między każdą parą kodów adresowych w przekroju czasowym (dzień/tydzień/miesiąc/rok)). Problem optymalizacji struktury systemu dekomponowany jest na dwa podproblemy: (1) lokalizacji i wymiarowania oddziałów firmy polegający na optymalizacji liczby, lokalizacji, przepustowości oddziałów oraz przydziału punktów kodowych do obsługi przez oddziały. Jako kryterium optymalizacji stosuje się sumaryczny koszt utworzenia i utrzymania oddziałów oraz koszty transportu przesyłek z punktów kodowych do oddziału i odwrotnie; (2) lokalizacji i wymiarowania sortowni oraz wyznaczania planu transportu. Problem (1) rozwiązano z wykorzystaniem zmodyfikowanej, randomizowanej metody klasteryzacji k-średnich na danych rzeczywistych dotyczących struktury i wolumenu przesyłek pochodzących z pewnej firmy kurierskiej. Przedstawiono wyniki badań na danych zbliżonych do rzeczywistych.

EN

The article presents a description, formulation and method of solving a certain problem of optimization of the structure of the distribution system in a selected logistics company in Poland. It was assumed that shipments are generated in the areas of address codes (more precisely: we know the volume of shipments between each pair of address codes in a time profile (day/week/month/year)). The problem of system structure optimization is decompressed into two subproblems: (1) location and dimensioning the company's branches by optimizing the number, location, bandwidth of branches and allocating code points to be serviced by the branches. The criterion for optimization is the total cost of establishing and maintaining branches and the costs of transporting shipments. From code points to the branch and vice versa; (2) location and dimensioning of the sorting plant and determination of the transport plan. Problem (1) solved using a modified, randomised clustering method k-means on the current data on the structure and volume of shipments from a certain courier company. Results of research on real data for the problem (1) are presented.

3

Zastosowanie metod taksonomicznych do analizy zużycia energii elektrycznej przez poszczególne województwa

Tutak M.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

|

2018

|

z. 117

675--686

PL

Najważniejszym czynnikiem wpływającym z jednej strony na rozwój gospodarczy i dobrobyt społeczeństwa, a z drugiej na łagodzenie skutków jego ubóstwa jest energia elektryczna i jej dostępność. Rozwijająca się gospodarka kraju generuje coraz większe zapotrzebowanie na energię. Poszczególne województwa Polski charakteryzują się różnym stopniem wykorzystania energii elektrycznej w podstawowych sektorach ekonomicznych. Wykorzystanie energii elektrycznej uzależnione jest od wielu czynników, m.in. od stopnia uprzemysłowienia regionu, lokalizacji elektrowni, a także od liczby ludności i gospodarstw domowych. W artykule przedstawiono wyniki analizy porównawczej zużycia energii elektrycznej w poszczególnych województwach Polski z uwzględnieniem sektorów ekonomicznych. Do uzyskania klasyfikacji województw w zakresie wykorzystania energii elektrycznej w sektorach ekonomicznych wykorzystano metodę analizy wielowymiarowej, która przyporządkowuje województwa do odpowiednich grup (skupień) o zbliżonej ilości zużycia energii elektrycznej.

EN

The most crucial factor influencing economic development and social well-being, as well as resulting in the mitigation of the effects of social poverty is electricity and its availability. The country’s growing economy generates an increasingly higher demand for energy. The individual Provinces of Poland have a different degree of electricity use in the basic economic sectors. The use of electricity is dependent on a number of factors, such as a given region’s degree of industrialisation, the locations of power plants, as well as the population and household numbers. The article presents the results of a comparative analysis of electricity consumption in the individual Provinces of Poland, with account being taken of the main economic sectors. The classification of the Provinces in terms of electricity use in economic sectors was performed by means of a multi-dimensional analysis method, which assigns the Provinces to appropriate groups (clusters) having similar quantities of electricity consumed.

4

Dobór urządzeń do zgrzewania oporowego punktowego z wykorzystaniem analizy skupień

Kędziorska M., Świerczyńska A., Rogalski G., Fydrych D.

Przegląd Spawalnictwa

|

2018

|

R. 90, nr 5

80--85

PL

W pracy omówiono zagadnienie doboru urządzeń do zgrzewania oporowego punktowego, stwierdzając na podstawie przeglądu literatury, że nie istnieje obiektywna metoda wspomagająca decyzję zakupu takich zgrzewarek. Do rozwiązania problemu zaproponowano zastosowanie metod analizy skupień. Zgromadzono i opracowano dane diagnostyczne opisujące 35 zgrzewarek oporowych punktowych, a następnie przeprowadzono ich klasyfikacje metodami Warda i k-średnich. Na podstawie porównania wyników wykazano, że analiza skupień może być stosowana jako wstępna metoda wspomagania decyzji zakupu urządzeń do zgrzewania oporowego punktowego.

EN

The paper presents the issue of selection of the resistance spot-welding machines, stating that there is no objective method of supporting the decision to purchase such devices. The application of cluster analysis method has been suggested for solving the problem. Diagnostic data describing 35 resistance spot-welding machines have been collected and then their classification has been made by the Ward and k-means methods. Based on the results, it has been concluded, that the eluster analysis can be an effective preliminary method of supporting the decision of purchasing resistance spot-welding machines.

5

A statistical approach for selecting buildings for experimental measurement of HVAC needs

Malinowski P., Ziembicki P.

Civil and Environmental Engineering Reports

|

2017

|

No. 24(1)

101--118

EN

This article presents a statistical methodology for selecting representative buildings for experimentally evaluating the performance of HVAC systems, especially in terms of energy consumption. The proposed approach is based on the k-means method. The algorithm for this method is conceptually simple, allowing it to be easily implemented. The method can be applied to large quantities of data with unknown distributions. The method was tested using numerical experiments to determine the hourly, daily, and yearly heat values and the domestic hot water demands of residential buildings in Poland. Due to its simplicity, the proposed approach is very promising for use in engineering applications and is applicable to testing the performance of many HVAC systems.

PL

W artykule przedstawiono statystyczną metodę wyboru budynków reprezentatywnych pod względem charakterystyki energetycznej oraz cech wbudowanych systemów grzewczych wentylacyjnych i klimatyzacyjnych. Proponowane podejście opiera się na metodzie k-średnich. Algorytm dla tej metody jest stosunkowo prosty, co pozwala na łatwe wdrożenie i nie wymaga dużego nakładu (kosztu) obliczeniowego. Sposób ten może być stosowany dla dużych ilości danych. Metodą k-średnich badano dane pozyskane w czasie inwentaryzacji obiektów oraz w wyniku symulacji komputerowych funkcjonowania budynków, zawierające m.in. roczne wartości zapotrzebowania na ciepło (symulowane z krokiem czasowym godzinnym). Z uwagi na względną prostotę metodyki oraz uzyskane bardzo dobre wyniki, proponowane podejście jest bardzo obiecujące dla zastosowań technicznych, w tym analiz budynków pod kątem systemów HVAC.

6

Wspomaganie decyzji zakupowych w branży spawalniczej za pomocą metody K-średnich

Rogalewicz M., Kujawińska A.

Zeszyty Naukowe Politechniki Poznańskiej. Organizacja i Zarządzanie

|

2016

|

Nr 70

203--214

PL

Podejmowanie decyzji w przedsiębiorstwie wiąże się często z wyborem najlepszego rozwiązania na podstawie wielu kryteriów opisujących analizowany problem. Z tego punktu widzenia można go nazwać wielokryterialnym problemem decyzyjnym. W artykule przedstawiono zastosowanie jednej z metod wspomagania decyzji – analizy skupień metodą k-średnich – w doborze materiałów dodatkowych do procesu spawania metodą SAW. Dokonano podziału na skupienia, uwzględniając dwa kryteria doboru ich początkowych centrów, porównano oba warianty, a na końcu scharakteryzowano szczegółowo grupy wyodrębnione za pomocą jednego z nich. Wybrane podejście do analizy skupień okazało się przydatne we wspomaganiu decyzji dotyczących zakupów w branży spawalniczej.

EN

Decision-making in enterprises is often connected with selecting the best solution on the basis of many criteria describing the analyzed problem. From this point of view, it can be called a multi–criterial decision–making problem. The article presents the use of a chosen clustering method – the k-means method – in the selection of materials for the SAW method process. Clusters were divided into two, based on the two different ways of choosing their initial centers. The two options were compared, and finally the clusters created on the basis of the chosen division were characterized in detail. The selected approach proved useful as decision-making support for purchasing materials in the welding industry.

7

Detection of Differently Loaded Power Network Areas

Okoń T., Wilkosz K.

Acta Energetica

|

2016

|

nr 2

166--170

EN

A widely accepted method of simplifying power system problems, especially for large system, is solving them for areas into which a system is divided. The paper considers separation of the power system areas that contain branches with similar active or reactive power loads. For this purpose rates are proposed that show the dependence of the branch power flow (active and reactive power flow separately) on the loads at system nodes. On the basis of the considered rates, branches are partioned into groups. The rates for all branches in the same group are similar. They significantly differ between groups. For selected groups of branches, which are characterized by values of the aforementioned rate larger than a preset value, the consistent area of the power network is found. The paper shows utilization of the method for the IEEE 14-bus test system.

PL

Uznanym sposobem upraszczania problemów dotyczących systemu elektroenergetycznego, szczególnie o dużych rozmiarach, jest ich rozwiązywanie dla obszarów, na które system jest dzielony. W pracy rozważane jest wyodrębnianie obszarów systemu elektroenergetycznego, obejmujących gałęzie o podobnym obciążeniu przepływem mocy czynnej albo biernej. Na potrzeby przedstawianej metody zostały wprowadzone wskaźniki pokazujące zależność przepływu mocy (osobno mocy czynnej oraz mocy biernej) w gałęzi od obciążeń w węzłach systemu. Na podstawie branego pod uwagę wskaźnika dokonano podziału gałęzi na grupy. Dla gałęzi, należących do jednej grupy, wartości wskaźnika są do siebie zbliżone. Różnią się one istotnie od wartości rozpatrywanego wskaźnika dla innych grup. Dla wyróżnionych grup znajdowane są spójne obszary sieci elektroenergetycznej, które charakteryzują wartości wymienionego wcześniej wskaźnika większe od zadanej wartości. Wykorzystanie przedstawionej metody jest pokazane na przykładzie 14-węzłowego systemu testowego IEEE.

8

Performance comparison of hybrid electromagnetism-like mechanism algorithms with descent method

Miyajima H., Shigei N., Miyajima H.

Journal of Artificial Intelligence and Soft Computing Research

|

2015

|

Vol. 5, No. 4

271--282

EN

Electromagnetism-like Mechanism (EM) method is known as one of metaheuristics. The basic idea is one that a set of parameters is regarded as charged particles and the strength of particles is corresponding to the value of the objective function for the optimization problem. Starting from any set of initial assignment of parameters, the parameters converge to a value including the optimal or semi-optimal parameter based on EM method. One of its drawbacks is that it takes too much time to the convergence of the parameters like other meta-heuristics. In this paper, we introduce hybrid methods combining EM and the descent method such as BP, k-means and FIS and show the performance comparison among some hybrid methods. As a result, it is shown that the hybrid EM method is superior in learning speed and accuracy to the conventional methods.

9

Analiza skupień jako metoda wspomagania decyzji zakupu urządzeń prądu stałego do spawania metodą TIG

Fydrych D., Sommer S., Rogalski G.

Logistyka

|

2014

|

nr 6

14158--14164, CD 6

PL

W pracy podjęto zagadnienie wspomagania decyzji zakupu odpowiedniego spawalniczego źródła prądu. Zaproponowano rozwiązanie problemu z wykorzystaniem metod analizy skupień. Przedstawiono wyniki klasyfikacji 69 urządzeń prądu stałego do spawania TIG metodami Warda i k-średnich dla odpowiednio dobranego i przygotowanego zestawu cech diagnostycznych. Na podstawie wyników uznano, że analiza skupień może być skuteczną metodą wspomagania decyzji zakupu analizowanych urządzeń spawalniczych, jednak może ona stanowić jedynie wstępny etap procesu decyzyjnego, który należy poprzeć szczegółową analizą merytoryczną.

EN

The paper presents an issue of decision support purchasing of suitable welding power source. Solution of the problem with the use of cluster analysis methods has been proposed. The results of classification of 69 devices for direct TIG welding process with the Ward and k-means methods for appropriately selected and prepared set of diagnostic features have been presented. From the results, it has been concluded that the cluster analysis can be an effective method of decision support purchasing of analyzed welding equipment, but it can only be a preliminary step of decision making process, which should be supported by a detailed substantive analysis.

10

Obiektowa implementacja algorytmu klasteryzacji metodą k-średnich

Dramski M.

Studia i Materiały Informatyki Stosowanej

|

2009

|

nr 1

25-27

PL

Algorytm klasteryzacji metodą k-średnich to jeden z najpopularniejszych sposobów służących do klasyfikacji danych przy użyciu metod sztucznej inteligencji. Otrzymane klastry mogą dalej posłużyć do budowy np. modeli neuronowych z wykorzystaniem dzwonów Gaussa (sieci RBF) czy rozmytych modeli Takagi-Sugeno. Niniejszy artykuł przedstawia implementację tego algorytmu języku C++. Można tu znaleźć opis klasy, która może później posłużyć jako biblioteka do dowolnego programu napisanego w tym języku

EN

K-means clustering algorithm is one of the most popular ways for data classification using artificial intelligence methods. Obtained clusters can be further used e.g. to build RBF networks or Takagi-Sugeno fuzzy models. This paper contains the implementation of this algorithm in C++ programming language. You can find there the description of the class, which can serve as a library in different programs written in C++.

11

Application of regression trees in the analysis of electricity load

Gładysz B., Kuchta D.

Badania Operacyjne i Decyzje

|

2008

|

nr 4

19-28

EN

In the paper electricity load analysis was performed for a power region in Poland. Identifying the factors that influence the electricity demand and determining the nature of the influence is a crucial element of an effective energy management. In order to analyse the electricity load level the CART (Classification and Regression Tree) method has been used. The data for the analysis are hourly observations of the electricity load and weather throughout one year period. Two categories of factors were taken as predictor variables, on which the demand for the electricity load depends: variables describing weather and variables representing structure days in a year. An analysis of the errors of the presented models was carried out.

PL

W artykule zbadano wpływ warunków atmosferycznych na poziom obciążenia systemu elektroenergetycznego. Identyfikacja czynników warunkujących wielkość popytu na energię elektryczną jest podstawowym elementem systemu zarządzania energią elektryczną. W badaniach zastosowano metodę k-średnich oraz technikę drzew klasyfikacyjnych i regresyjnych. W pierwszym etapie badań metodą k-średnich wyróżniono jednorodne - z uwagi na obciążenie systemu elektroenergetycznego - grupy godzin w skali doby. Dla każdej z grup dla wybranej godziny (reprezentanta) zbudowano drzewo regresyjne, przyjmując jako czynniki dane meteorologiczne oraz typ dnia w skali roku. Przeprowadzona analiza pokazała, że czynnikami warunkującymi poziom obciążenia systemu energetycznego są: temperatura, punkt rosy, wilgotność oraz rodzaj opadów. Informacja o rodzaju oraz wartościach progowych tych czynników meteorologicznych może zostać wykorzystana w procesie prognozowania poziomu obciążenia systemu elektroenergetycznego i tym samym przyczynić się do poprawy efektywności procesów zarządzania energią. Przeprowadzono analizę błędów skonstruowanych drzew regresyjnych.