Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 125

Liczba wyników na stronie
first rewind previous Strona / 7 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  obliczenia równoległe
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 7 next fast forward last
EN
Material parameters identification by inverse analysis using finite element computations leads to the resolution of complex and time-consuming optimization problems. One way to deal with these complex problems is to use meta-models to limit the number of objective function computations. In this paper, the Efficient Global Optimization (EGO) algorithm is used. The EGO algorithm is applied to specific objective functions, which are representative of material parameters identification issues. Isotropic and anisotropic correlation functions are tested. For anisotropic correlation functions, it leads to a significant reduction of the computation time. Besides, they appear to be a good way to deal with the weak sensitivity of the parameters. In order to decrease the computation time, a parallel strategy is defined. It relies on a virtual enrichment of the meta-model, in order to compute q new objective functions in a parallel environment. Different methods of choosing the qnew objective functions are presented and compared. Speed-up tests show that Kriging Believer (KB) and minimum Constant Liar (CLmin) enrichments are suitable methods for this parallel EGO (EGO-p) algorithm. However, it must be noted that the most interesting speed-ups are observed for a small number of objective functions computed in parallel. Finally, the algorithm is successfully tested on a real parameters identification problem.
PL
W pracy przedstawiono algorytm rozwiązywania równań ruchu płynu metody „Wir w Komórce” z wykorzystaniem różnicowego schematu kompaktowego rzędu czwartego do rozwiązywania równania Poissona i równania dyfuzji. Opisano kolejne kroki algorytmu wraz z badaniami dokładności poszczególnych schematów różnicowych. Program obliczeniowy został sprawdzony na przykładzie popularnego zagadnienia przepływu we wnęce. Otrzymane wyniki porównano z wynikami opublikowanymi przez innych autorów.
EN
The second part of the paper continues a discussion on the topic of paralel computations in railway dynamics. The algorithms described in the first part of the paper are applied to parallel simulation on computers with multicore processors of six different models of rail vehicles and trains with the number of degrees of freedom from about one hundred to more than 20 thousands. A considerable simulation speedup is reported. In addition, an example of evaluation of wheel profile wear on multicore processors and comparison of different approaches to multi-variant computations are considered.
EN
Parallel computations speed up simulation of multibody system dynamics, in particular, dynamics of railway vehicles and trains. It is important for reduction of required time at the stage of new railway vehicle design, for increase of complexity of studied problems and for real-time applications. We consider realization of paralel computations in Universal Mechanism software in three different areas: simulation of rail vehicle and train dynamics, evaluation of wheel profile wear and multi-variant computations. The use of clusters for parallel running of multi-variant computations is illustrated. Co-simulation based on the interface between Universal Mechanism and Matlab/Simulink and other software tools is discussed.
EN
In this work, we explore the possibilities of the widespread Finite Element Model Updating method (FEMU) in order to identify the local elastic mechanical properties in heterogeneous materials. The objective function is defined as a quadratic error of the discrepancy between measured fields and simulated ones. We compare two different formulations of the function, one based on the displacement fields and one based on the strain fields. We use a genetic algorithm in order to minimize these functions. We prove that the strain functional associated with the genetic algorithm is the best combination. We then improve the implementation of the method by parallelizing the algorithm in order to reduce the computation cost. We validate the approach with simulated cases in 2D.
PL
W pracy przedstawiono algorytm rozwiązywania równań ruchu płynu z wykorzystaniem kompaktowej, czwartorzędowej metody „Vortex in Cell“. W pierwszej części zawarto sposób budowania układów równań liniowych z wykorzystaniem wysokowydajnej biblioteki hypre. Przedstawiono kolejne kroki algorytmu wraz z badaniami dokładności i wydajności obliczeniowej poszczególnych schematów różnicowych. Ostatecznie przedstawiono badanie dokładności działania metody na przykładzie zagadnienia Taylora-Greena ze znanym rozwiązaniem dokładnym i porównano otrzymane wyniki z wartościami dokładnymi.
PL
W artykule poruszono zagadnienia związane z wykorzystaniem obliczeń równoległych przy implementacji algorytmów sterowania bazujących na zasadach logiki rozmytej. Przedstawiono realizację przykładowego regulatora, w którym wykorzystano standard specyfikacji przetwarzania współbieżnego OpenMP oraz QtConcurrent. Opisano przeprowadzone badania porównawcze standardowego algorytmu sekwencyjnego z algorytmem wykorzystującym obliczenia równoległe pod względem szybkości działania.
EN
In the paper issues related to the use of a parallel computation in the implementation of control algorithms based on the principles of fuzzy logic have been described. The implementation of an exemplary regulator, in which the OpenMP standard and QtConcurrent is used has been presented. Comparative studies of a standard sequential algorithm with an algorithm that uses a parallel computation in terms of speed of operation were described.
PL
Zapotrzebowanie na możliwości obliczeniowe nieustannie wzrasta w wielu dziedzinach wiedzy. Dotyczy to również działów, które wcześniej uznawane były za niewymagające obliczeniowo. Szczególną odpowiedzią jest technologia superkomputerów, których liczba dynamicznie zwiększa się. Możliwość rozwoju poszczególnych dziedzin może zostać w znacznym stopniu ułatwiona dzięki rozwojowi technologii Obliczeń Ogólnego Przeznaczenia z użyciem typowych graficznych procesorów masowo równoległych. W artykule zawarto kompletny opis budowy superkomputera w architekturze węzłowej, wraz z opisem problemów związanych z praktyczną implementacją.
EN
Nowadays computational demands are rapidly growing in many scientific areas. This also applies to engineering branches that were previously considered as not very computationally demanding. The answer is supercomputer technology, the number of which is dynamically increasing. Attention should be given to supercomputers, with General Purpose Graphical Processing Unit technology. Such coprocessor could easily enhance computational power in many scientific areas of interest. The paper describes node architecture of supercomputer with description of practical implementation problems.
9
Content available remote Multi-thread evolutionary computation for design optimization
EN
The paper presents multi-thread calculations using parallel evolutionary algorithms (EA) for single and multicriteria design optimization. This approach was implemented to avoid a negative influence of incorrectly chosen initial and EA’s control parameters for the accuracy of generated solutions and thereby to improve the effectiveness of the EA’s use. Parallel computation for single optimization problems relies just on running n threads with different randomly chosen parameters in order to find the best final solution. For multicriteria optimization problems, each thread generates a set of Pareto optimal solutions and at the end these sets are combined together, giving a real set of Pareto optimal solutions. During the run of the algorithm, random interactions between threads were applied. The experiments were carried out using tenthread processes for different examples of single and multicriteria design optimization problems, two of which are presented in the paper.
PL
W artykule przedstawiono wielowątkowe obliczenia równoległe z wykorzystaniem algorytmów ewolucyjnych (AE) dla jedno- i wielokryterialnej optymalizacji konstrukcji. Przedstawioną metodę wykorzystano w celu uniknięcia negatywnego wpływu niewłaściwie dobranych parametrów inicjujących i sterujących w algorytmie ewolucyjnym na dokładność obliczeń, a tym samym w celu poprawy efektywności działania algorytmu. Obliczenia równoległe dla optymalizacji jednokryterialnej polegają na uruchomieniu n wątków z losowo dobranymi parametrami AE z przyjętych zakresów i zbiorów dyskretnych. Dla optymalizacji wielokryterialnej każdy wątek generuje niezależny zbiór rozwiązań Pareto, a następnie na końcu zbiory te są łączone w finalny zbiór rozwiązań Pareto. W trakcie obliczeń wprowadzono losowe interakcję między wątkami. Eksperymenty przeprowadzono z wykorzystaniem 10 wątków równoległych dla wielu przykładów, dwa przedstawiono w artykule.
EN
This paper presents the non-interior point method (NIP) based optimal power flow (OPF) algorithm parallelization and performance improvement experiments. The aim is to investigate the impact of parallelization techniques on overall OPF computations speedup. Presented approach takes advantage of the structure of algorithm and exploits it with the usage of multithreading to gain computation speedup. Obtained results give insight into the impact of multithreading techniques and algorithm initialization techniques.
PL
W artykule zaprezentowano wyniki eksperymentów prowadzących do redukcji czasu realizacji obliczeń algorytmu metody non-interior point (NIP) w zastosowaniu do zadania optymalizacji rozpływu mocy (OPF). Celem pracy było zbadanie wpływu zastosowania technik zrównoleglenia obliczeń na czas realizacji zadania OPF. W zaprezentowanym podejściu brano pod uwagę strukturę algorytmu oraz wykorzystano implementację wielowątkową. Uzyskane wyniki pokazują wpływ wielowątkowej implementacji oraz zastosowanych technik inicjalizacji algorytmu na czas obliczeń.
PL
W artykule przedstawiono autorskie algorytmy obliczeń równoległych które zostały zastosowane w oprogramowaniu do diagnostyki silnika LSPMSM. Oprogramowanie umożliwia spektralną i falkową analizę prądu maszyny a także posiada wbudowane mechanizmy sztucznych sieci neuronowych (SSN) które to mogą służyć jako element decyzyjny systemu diagnostycznego. Ponadto przybliżono tematykę związaną ze strukturą zastosowanej sieci neuronowej, algorytmami nauczania sztucznych sieci neuronowych oraz standardem OpenCL.
EN
The paper presents algorithms of parallel computing which have been used in program for diagnosis of LSPMSM machine. The software allows to spectral and wavelet analysis of phase current of LSPMSM motor. Moreover, the program has a built-in artificial neural network which is a decisive element of the diagnostic system. In addition, the article brought closer to issues related to the structure and learning algorithms of artificial neural networks and OpenCL.
EN
When running data-mining algorithms on big data platforms, a parallel, distributed framework, such as MAPREDUCE, may be used. However, in a parallel framework, each individual model fits the data allocated to its own computing node without necessarily fitting the entire dataset. In order to induce a single consistent model, ensemble algorithms such as majority voting, aggregate the local models, rather than analyzing the entire dataset directly. Our goal is to develop an efficient algorithm for choosing one representative model from multiple, locally induced decision-tree models. The proposed SySM (syntactic similarity method) algorithm computes the similarity between the models produced by parallel nodes and chooses the model which is most similar to others as the best representative of the entire dataset. In 18.75% of 48 experiments on four big datasets, SySM accuracy is significantly higher than that of the ensemble; in about 43.75% of the experiments, SySM accuracy is significantly lower; in one case, the results are identical; and in the remaining 35.41% of cases the difference is not statistically significant. Compared with ensemble methods, the representative tree models selected by the proposed methodology are more compact and interpretable, their induction consumes less memory, and, as confirmed by the empirical results, they allow faster classification of new records.
EN
Computed tomography (CT) is a widely used imaging technique in medical diagnosis. Among the latest advances in CT imaging techniques, the use of cone-beam X-ray projections, instead of the usual planar fan beam, promises faster yet safer 3D imaging in comparison to the previous CT imaging methodologies. This technique is called Cone Beam CT (CBCT). However, these advantages come at the expense of a more challenging 3D reconstruction problem that is still an active research area to improve the speed and quality of image reconstruction. In this paper, we propose a rapid parallel Multiplicative Algebraic Reconstruction Technique (rpMART) via a vectorization process for CBCT which gives more accurate and faster reconstruction even with a lower number of projections via parallel computing. We have compared rpMART with the parallel version of Algebraic Reconstruction Technique (pART) and the conventional non-parallel versions of npART, npMART and Feldkamp, Davis, and Kress (npFDK) techniques. The results indicate that the reconstructed volume images from rpMART provide a higher image quality index of 0.99 than the indices of pART and npFDK of 0.80 and 0.39, respectively. Also the proposed implementation of rpMART and pART via parallel computing significantly reduce the reconstruction time from more than 6 h with npART and npMART to 580 and 560 s with the full 360° projections data, respectively. We consider that rpMART could be a better image reconstruction technique for CBCT in clinical applications instead of the widely used FDK method.
EN
Two models of side thermal insulation (adiabatic and lossy) were examined in the analysis of the operation of electrical floor heater. Temperature field distributions obtained in both cases were compared. Computation costs of consideration of edge effects resulted from insulation lossiness were estimated. The use of parallel operation of a traditional processor (CPU) and a graphics processing unit (GPU) enabled a significant reduction of the computation time.
PL
W analizie pracy elektrycznego grzejnika podłogowego rozpatrywano dwa modele bocznej izolacji termicznej (idealnej i rzeczywistej). Porównano rozkłady pola temperatury wyznaczone w wymienionych przypadkach. Oszacowano obliczeniowe koszty uwzględnienia efektów krawędziowych spowodowanych stratnością izolacji. Zastosowanie równoległej pracy tradycyjnego procesora (CPU) oraz procesora karty graficznej (GPU) umożliwiło znaczne skrócenie czasu obliczeń numerycznych.
15
Content available remote Parallel computation of transient processes on OpenCL framework
EN
Parallel execution of calculation of transient analysis is based on a split-level model into sub-systems, which in certain time increments are calculated independently of each other. Each such process has a high computational complexity. The process of implementing the calculation allows the use of parallel systems to calculations based on the use of the GPU, whose dynamic growth has been observed for several years. The article presents a brief description of parallel computing systems based on the OpenCL platform that uses GPUs. There is described the ability to implement the algorithm using this platform. There is also discussed, the timing to perform operations on GPU in relation to the calculations for classic CPU.
PL
Równoległa realizacja obliczeń analizy stanów przejściowych bazuje na podziale na poziomie modelu na pod-układy, które w określonych krokach czasowych obliczane są niezależnie od siebie. Każdy taki proces charakteryzuje się dużą złożonością obliczeniową. Proces realizacji obliczeń pozwala na zastosowanie do obliczeń systemów równoległych opartych o wykorzystanie GPU, których dynamiczny rozwój jest obserwowany od kilku lat. W artykule przedstawiono krótką charakterystykę równoległych systemów obliczeniowych opartych o platformę OpenCL wykorzystującą procesory GPU. Opisano możliwość implementacji algorytmu z wykorzystaniem tej platformy. Omówiono zależności czasowe realizacji obliczeń na procesorach graficznych w stosunku do obliczeń na klasycznych CPU.
16
Content available remote Effectiveness of Fast Fourier Transform implementations on GPU and CPU
EN
In this paper, we present the results of comparison of the effectiveness of selected variants of radix-2 Fast Fourier Transform (FFT) algorithms implemented on both Graphics (GPU) and Central (CPU) Processing Units. The considered algorithms differ in memory consumption and the arrangement of data-flow paths which affects the global memory coalescing and cache memory exploitation. The obtained results allow to indicate the variants of FFT algorithms which are best suited for GPU and CPU architectures, to confirm the advisability of GPU oriented calculations of FFT and to formulate a guideline for implementations of fast algorithms of various linear transforms.
XX
W niniejszej pracy przedstawiono wyniki porównania efektywności wybranych wariantów algorytmów szybkiej transformaty Fouriera (FFT) typu radix-2 realizowanych zarówno dla procesorów graficznych (GPU) jak i typowych jednostek centralnych (CPU). Rozważane algorytmy różnią się zapotrzebowaniem pamięciowym oraz postaciami grafów przepływu danych, które mają wpływ na spójność wykorzystania pamięci globalnej oraz pamięci cache jednostek GPU i CPU. Uzyskane wyniki pozwalają na wskazanie wariantów algorytmów FFT, które są najlepiej dostosowane dla architektur GPU i CPU, pozwalają też potwierdzić celowość realizacji implementacji FFT zorientowanych na wykorzystanie jednostek GPU, a także sformułować ogólne wytyczne dla implementacji zorientowanych na wykorzystanie jednostek GPU algorytmów szybkich przekształceń liniowych.
PL
W artykule przedstawiono zastosowanie algorytmów obliczeń równoległych oraz funkcji zawartych w bibliotece OpenCL do analizy harmonicznej i analizy falkowej prądu fazowego silnika LSPMSM. Opisano interface programowania OpenCL oraz opracowane oprogramowanie w języku C++, w którym zaimplementowano zarówno algorytmy sekwencyjne realizowane przez CPU jak również algorytmy równoległe realizowane przez GPU. Przedstawiono porównanie czasu obliczeń algorytmem sekwencyjnym oraz algorytmem równoległym.
EN
The article presents a comparison of a computing time of a parallel and a sequential algorithm in a spectral and a wavelet analysis of a motor LSPMSM current. The test calculations were made on two different sets of computer for different number of signals samples. On the basis of the results of test calculations of harmonic analysis it can be observed that using parallel algorithm a signal processing time has been reduced of several times compared to a sequential algorithm. The advantage of the parallel algorithm is the greater, the more signal samples are processed.
18
Content available remote Obliczenia w chmurze i obliczenia gridowe
PL
Celem artykułu jest przegląd nowych technologii informatycznych, a w szczególności tych, które mają wpływ na obliczenia o dużej złożoności i wymagające użycia sporych mocy obliczeniowych. Zaprezentowano możliwości obliczeń w chmurze i obliczeń gridowych. Przedstawiono przykłady gridów i chmur obliczeniowych. Wskazano na korzyści płynące dla nauki i przemysłu ze stosowania nowych technologii obliczeń.
EN
The objective of this paper is to give an overview of new information technologies, particular those which influence high complex computing and require the use of considerable computing power. This article presents possibilities of cloud and grid computing. The grid and cloud computing applications and implementations are presented. It points out the benefits that science and industry have gained, due to the application of new computing technologies.
EN
Coal gasification is recognized as one of clean coal technologies. Though it has been known for a relatively long time, its complexity still challenges scientists all over the world. One of the tools used in the research is simulation. The presented work investigates the capabilities of using GPGPU in modeling coal gasification. The selected set of models is used (volumetric, non-reactive core and Johnson’s). The models as well as numeric solution methods were implemented as a sequential and parallel code. The execution time for both methods was investigated and the speedup for the parallel code determined. The influence of mathematical function call in the GPU code was also checked. The results show that for all models the parallel code gives significant speedup over the serial counterpart, as long as a reasonably large equation set is used. Therefore, using a dedicated GPU code for coal gasification simulations is highly recommended, whenever big systems of ODE have to be solved.
PL
Gazyfikacja węgla uznawana jest za jedną z tzw. czystych technologii węglowych. Chociaż jest znana już względnie długo, jej złożoność wciąż pozostaje wyzwaniem dla naukowców na całym świecie. Jednym z narzędzi używanych w badaniach jest symulacja. W pracy zbadano możliwości użycia GPGPU w modelowaniu gazyfikacji węgla. Użyto wybranego zbioru modeli (objętościowego, rdzenia bezreaktacyjnego i Johnsona). Modele oraz metody rozwiązań numerycznych zaimplementowano, jako kod szeregowy i równoległy. Zbadano czas realizacji obydwu metod oraz określono przyspieszenie kodu równoległego. Sprawdzono również wpływ wywołania funkcji matematycznej w kodzie GPU. Wyniki wskazują, że dla wszystkich modeli kod równoległy powoduje znaczne przyspieszenie obliczeń w stosunku do odpowiednika szeregowego, pod warunkiem, że użyje się wystarczająco dużego zbioru równań. Dlatego zaleca się użycie dedykowanego kodu GPU do symulacji gazyfikacji węgla w każdym przypadku, gdy wymagane jest rozwiązanie dużych systemów ODE.
PL
Praca prezentuje aspekt adaptacji oraz wykorzystywania algorytmów zaprezentowanych w publikacji [1] na platformie do obliczeń rozproszonych BOINC [2]. Dodatkowo wykonano testy skalowalności przyśpieszenia oprogramowania na takich platformach jak Intel Xeon Phi 5110P [3] oraz platformie wykorzystującej Versatile SMP Foundation Advanced Platform firmy ScaleMP (rozwiązanie klasy vSMP [4][5]). Dzięki długotrwałym obliczeniom udało się znaleźć 47 rozwiązań przystających prawidłowo modulo 264. Żadne z uzyskanych rozwiązań nie jest jednak prawidłowe w przestrzeni całego zbioru liczb naturalnych, a co za tym idzie nie odnaleziono poprawnego kontrprzykładu dla przypuszczenia Beal'a.
EN
This paper presents adaptation aspect and use of algorithms presented in publication [1] on distributed computing platform BOINC. What is more, there were made some test of software acceleration scalability on such platforms like Intel Xeon Phi 5110P and platform that uses Versatile SMP Foundation Advanced Platform made by ScaleMP. Thanks to long-lasting computation 47 solutions correctly congruent modulo 264 were found. None of the solutions obtained is not correct in the space around the set of natural numbers and what’s connected to that, any correct counterexample for Beal’s Conjecture was not found.
first rewind previous Strona / 7 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.