Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 27

Liczba wyników na stronie
first rewind previous Strona / 2 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  parallel computation
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 2 next fast forward last
PL
W artykule przedstawiono numeryczną analizę nieustalonego pola temperatury w trójwymiarowym modelu elektrycznego grzejnika podłogowego. Sformułowano odpowiednie zagadnienie brzegowo-początkowe, które dyskretyzowano niejawną metodą różnic skończonych. Otrzymane układy równań rozwiązano przy wykorzystaniu metody BiCGStab i procesora GPU. Dodatkowe zastosowanie procesora GPU pozwoliło ponad 5-krotnie skrócić czas obliczeń w stosunku do programu pracującego tylko na procesorze CPU.
EN
This paper presents the numerical analysis of the transient temperature field in a three-dimensional model of an electric floor heater. An appropriate initial-boundary value problem was formulated, which was discretised using the implicit finite difference method. Obtained systems of equations were solved using the BiCGStab method and the GPU. The additional application of the GPU reduced the time of computations over 5 times compared to the program executed only on the CPU.
EN
Material parameters identification by inverse analysis using finite element computations leads to the resolution of complex and time-consuming optimization problems. One way to deal with these complex problems is to use meta-models to limit the number of objective function computations. In this paper, the Efficient Global Optimization (EGO) algorithm is used. The EGO algorithm is applied to specific objective functions, which are representative of material parameters identification issues. Isotropic and anisotropic correlation functions are tested. For anisotropic correlation functions, it leads to a significant reduction of the computation time. Besides, they appear to be a good way to deal with the weak sensitivity of the parameters. In order to decrease the computation time, a parallel strategy is defined. It relies on a virtual enrichment of the meta-model, in order to compute q new objective functions in a parallel environment. Different methods of choosing the qnew objective functions are presented and compared. Speed-up tests show that Kriging Believer (KB) and minimum Constant Liar (CLmin) enrichments are suitable methods for this parallel EGO (EGO-p) algorithm. However, it must be noted that the most interesting speed-ups are observed for a small number of objective functions computed in parallel. Finally, the algorithm is successfully tested on a real parameters identification problem.
EN
In this work, we explore the possibilities of the widespread Finite Element Model Updating method (FEMU) in order to identify the local elastic mechanical properties in heterogeneous materials. The objective function is defined as a quadratic error of the discrepancy between measured fields and simulated ones. We compare two different formulations of the function, one based on the displacement fields and one based on the strain fields. We use a genetic algorithm in order to minimize these functions. We prove that the strain functional associated with the genetic algorithm is the best combination. We then improve the implementation of the method by parallelizing the algorithm in order to reduce the computation cost. We validate the approach with simulated cases in 2D.
4
Content available remote Multi-thread evolutionary computation for design optimization
EN
The paper presents multi-thread calculations using parallel evolutionary algorithms (EA) for single and multicriteria design optimization. This approach was implemented to avoid a negative influence of incorrectly chosen initial and EA’s control parameters for the accuracy of generated solutions and thereby to improve the effectiveness of the EA’s use. Parallel computation for single optimization problems relies just on running n threads with different randomly chosen parameters in order to find the best final solution. For multicriteria optimization problems, each thread generates a set of Pareto optimal solutions and at the end these sets are combined together, giving a real set of Pareto optimal solutions. During the run of the algorithm, random interactions between threads were applied. The experiments were carried out using tenthread processes for different examples of single and multicriteria design optimization problems, two of which are presented in the paper.
PL
W artykule przedstawiono wielowątkowe obliczenia równoległe z wykorzystaniem algorytmów ewolucyjnych (AE) dla jedno- i wielokryterialnej optymalizacji konstrukcji. Przedstawioną metodę wykorzystano w celu uniknięcia negatywnego wpływu niewłaściwie dobranych parametrów inicjujących i sterujących w algorytmie ewolucyjnym na dokładność obliczeń, a tym samym w celu poprawy efektywności działania algorytmu. Obliczenia równoległe dla optymalizacji jednokryterialnej polegają na uruchomieniu n wątków z losowo dobranymi parametrami AE z przyjętych zakresów i zbiorów dyskretnych. Dla optymalizacji wielokryterialnej każdy wątek generuje niezależny zbiór rozwiązań Pareto, a następnie na końcu zbiory te są łączone w finalny zbiór rozwiązań Pareto. W trakcie obliczeń wprowadzono losowe interakcję między wątkami. Eksperymenty przeprowadzono z wykorzystaniem 10 wątków równoległych dla wielu przykładów, dwa przedstawiono w artykule.
5
Content available remote Fast and Efficient Parallel Coarsest Refinement
EN
The process of merging two arbitrary partitions of a given finite set U of n elements is known as coarsest refinement. In the COARSEST REFINEMENT PROBLEM we are given two arbitrary partitions X, Y of the set U such that X = {X1, X2, ...,Xx} and Y = {Y1, Y2, ..., Yy}, and determine a new partition Z = {Z1, Z2, ..., Zz} such that each is a common non-empty subset of some Xa ∈ X and some Yb ∈ Y and |Z| is as small as possible. This article describes a resource-efficient parallel algorithm to solve this problem. More specifically, we show that a coarsest refinement can be computed in O(t(n) + log n) parallel time using max{nlogn, p(n)} processors, where t(n) denotes the running time of a parallel stable sorting algorithm that uses p(n) processors on an EREW PRAM. This result depends on t(n) and p(n). We give a table that shows the best known time and processor complexities for a parallel stable sorting algorithm. If the parallel stable sorting algorithms by Ajtai et al., Cole, and Leighton are used, the coarsest refinement can be computed in O(log n) parallel time using n processors on an EREW PRAM. On the other hand, if the parallel stable sorting algorithm by Bahig et al. is used, the coarsest refinement can be computed in O(lognlog(nlogn)) parallel time using nlogn processors on an EREW PRAM. In addition, we show that on, a RAM machine, our parallel algorithm runs as asymptotically efficient as the fastest known sequential algorithm.
EN
Two models of side thermal insulation (adiabatic and lossy) were examined in the analysis of the operation of electrical floor heater. Temperature field distributions obtained in both cases were compared. Computation costs of consideration of edge effects resulted from insulation lossiness were estimated. The use of parallel operation of a traditional processor (CPU) and a graphics processing unit (GPU) enabled a significant reduction of the computation time.
PL
W analizie pracy elektrycznego grzejnika podłogowego rozpatrywano dwa modele bocznej izolacji termicznej (idealnej i rzeczywistej). Porównano rozkłady pola temperatury wyznaczone w wymienionych przypadkach. Oszacowano obliczeniowe koszty uwzględnienia efektów krawędziowych spowodowanych stratnością izolacji. Zastosowanie równoległej pracy tradycyjnego procesora (CPU) oraz procesora karty graficznej (GPU) umożliwiło znaczne skrócenie czasu obliczeń numerycznych.
7
Content available remote Parallel computation of transient processes on OpenCL framework
EN
Parallel execution of calculation of transient analysis is based on a split-level model into sub-systems, which in certain time increments are calculated independently of each other. Each such process has a high computational complexity. The process of implementing the calculation allows the use of parallel systems to calculations based on the use of the GPU, whose dynamic growth has been observed for several years. The article presents a brief description of parallel computing systems based on the OpenCL platform that uses GPUs. There is described the ability to implement the algorithm using this platform. There is also discussed, the timing to perform operations on GPU in relation to the calculations for classic CPU.
PL
Równoległa realizacja obliczeń analizy stanów przejściowych bazuje na podziale na poziomie modelu na pod-układy, które w określonych krokach czasowych obliczane są niezależnie od siebie. Każdy taki proces charakteryzuje się dużą złożonością obliczeniową. Proces realizacji obliczeń pozwala na zastosowanie do obliczeń systemów równoległych opartych o wykorzystanie GPU, których dynamiczny rozwój jest obserwowany od kilku lat. W artykule przedstawiono krótką charakterystykę równoległych systemów obliczeniowych opartych o platformę OpenCL wykorzystującą procesory GPU. Opisano możliwość implementacji algorytmu z wykorzystaniem tej platformy. Omówiono zależności czasowe realizacji obliczeń na procesorach graficznych w stosunku do obliczeń na klasycznych CPU.
8
Content available remote Effectiveness of Fast Fourier Transform implementations on GPU and CPU
EN
In this paper, we present the results of comparison of the effectiveness of selected variants of radix-2 Fast Fourier Transform (FFT) algorithms implemented on both Graphics (GPU) and Central (CPU) Processing Units. The considered algorithms differ in memory consumption and the arrangement of data-flow paths which affects the global memory coalescing and cache memory exploitation. The obtained results allow to indicate the variants of FFT algorithms which are best suited for GPU and CPU architectures, to confirm the advisability of GPU oriented calculations of FFT and to formulate a guideline for implementations of fast algorithms of various linear transforms.
XX
W niniejszej pracy przedstawiono wyniki porównania efektywności wybranych wariantów algorytmów szybkiej transformaty Fouriera (FFT) typu radix-2 realizowanych zarówno dla procesorów graficznych (GPU) jak i typowych jednostek centralnych (CPU). Rozważane algorytmy różnią się zapotrzebowaniem pamięciowym oraz postaciami grafów przepływu danych, które mają wpływ na spójność wykorzystania pamięci globalnej oraz pamięci cache jednostek GPU i CPU. Uzyskane wyniki pozwalają na wskazanie wariantów algorytmów FFT, które są najlepiej dostosowane dla architektur GPU i CPU, pozwalają też potwierdzić celowość realizacji implementacji FFT zorientowanych na wykorzystanie jednostek GPU, a także sformułować ogólne wytyczne dla implementacji zorientowanych na wykorzystanie jednostek GPU algorytmów szybkich przekształceń liniowych.
PL
W artykule przedstawiono analizę porównawczą dotyczącą badania efektywności kilku równoległych implementacji algorytmu Gaussa-Seidela. Analizowany w artykule algorytm pozwala na osiągnięcie dosyć dobrych pod względem szybkości zbieżności oraz wartości współczynnika przyspieszenia obliczeń wyników w porównaniu do standardowej sekwencyjnej oraz równoległej implementacji metody Gaussa-Seidela. Obliczenia praktyczne przeprowadzono w środowisku procesorów wielordzeniowych oraz w środowisku klastrów obliczeniowych.
EN
The paper presents the results of the efficiency analysis of some parallel implementations of Gauss-Seidel algorithm. The main idea of the presented method consists in successive modification of the search directions used in the computations. This modification is performed on the basis of solutions of local optimization subproblems received for all stages of the algorithm. The analyzed algorithm enable to achieve a good efficiency of parallel computation in terms of speed of convergence and value of speedup factor in comparison to standard sequential and parallel implementation of Gauss-Seidel method. Parallel computation were implemented in the multicore processor and multiprocessor cluster.
PL
W pracy zaprezentowano system internetowy dla aplikacji wykorzystującej obliczenia równoległe oraz obiektowe techniki programowania do modelowania procesu walcowania blach z występowaniem strefy półciekłej. Określenie granicy plastyczności dla stali w stanie półciekłym jest niezwykle trudne, a niezbędne dane w postaci krzywych naprężenie-odkształcenie w wysokich temperaturach można uzyskać jedynie przy zastosowaniu analizy odwrotnej. Ze względu na ograniczenie dostępnych zasobów komputerowych, a także złożoność modeli obliczeniowych, bardzo dokładne analizy mogą być czasochłonne, a w pewnych przypadkach nawet niemożliwe. Autorzy, wykorzystując obliczenia równoległe, opracowali algorytm pozwalający na szybkie obliczenia przy użyciu wielu procesorów, co jest głównym przedmiotem niniejszej pracy.
EN
The paper presents web base system for an application of parallel object-oriented programming technique in modelling of rolling process of steel plates with semi-solid zone. It also throws light on the problem of semi-solid steels yield stress relationship, one of the main input data of the simulation, and on application of inverse solution, the only possible method of development of the stress-strain curves at extremely high temperatures. Due to limitations of available computer resources a very accurate computation can sometimes be impossible or the time performance can be a barrier for practical application of complex sequential models. Taking advantage of parallel computing the authors have developed an algorithm allowing for fast computation using multiple processors, which is the main subject of the presented paper.
EN
The paper presents web base system for an application of parallel object-oriented programming technique in modelling of rolling process of steel plates with semi-solid zone. It also throws light on the problem of semi-solid steels yield stress relationship, one of the main input data of the simulation, and on application of inverse solution, the only possible method of development of the stress-strain curves at extremely high temperatures. Due to limitations of available computer resources a very accurate computation can sometimes be impossible or the time performance can be a barrier for practical application of complex sequential models. Taking advantage of parallel computing the authors have developed an algorithm allowing for fast computation using multiple processors, which is the main subject of the presented paper.
PL
W pracy zaprezentowano system internetowy dla aplikacji wykorzystującej obliczenia równoległe oraz obiektowe techniki programowania do modelowaniu procesu walcowania blach z występowaniem strefy półciekłej. Określenie granicy plastyczności dla stali w stanie półciekłym jest niezwykle trudne, niezbędne dane w postaci krzywych naprężenie-odkształcenie w ekstra wysokich temperaturach można uzyskać jedynie przy zastosowaniu analizy odwrotnej. Ze względu na ograniczenie dostępnych zasobów komputerowych, a także złożoność modeli obliczeniowych, bardzo dokładne analizy mogą być bardzo czasochłonne, a w pewnych przypadkach nawet niemożliwe. Autorzy, wykorzystując obliczenia równoległe, opracowali algorytm pozwalający na szybkie obliczenia przy użyciu wielu procesorów, co jest głównym przedmiotem niniejszej pracy.
EN
The paper deals with the speed up of a computer program, which simulates rolling of steel with semi-solid zone. The mathematical models describing the rolling process are fully three dimensional. It leads to very long computation time while the discretization of the problem is made in finite element manner. The main objectives of the contribution are optimization of the program code, as well as making of the first look at possibilities of parallel computation in application to the presented problem. The paper has proved that efficient optimization of the program code can lead to significant shortening of the computation time also with the automatic and manual parallelization. It was concluded that adaptation of the procedures and loops to rigorous requirements of the parallel compiler is strongly recommended.
PL
W artykule przedstawiono metody zwiększenia efektywności programu modelującego proces walcowania stali ze strefą półciekłą. Modele matematyczne opisujące proces walcowania są w pełni trójwymiarowe, co prowadzi do bardzo długich czasów obliczeń. Dyskretyzację problemu wykonano przy użyciu metody elementów skończonych. Głównymi celami artykułu są: optymalizacja kodu programu oraz ocena możliwości zastosowania obliczeń równoległych. Przeprowadzone testy udowodniły, że optymalizacja kodu programu może doprowadzić do znacznego skrócenia czasu obliczeń, również w połączeniu z automatycznymi ręcznym zrównolegleniem. W celu efektywnego zrównoleglenia automatycznego, konieczne jest dostosowanie procedur i pętli do rygorystycznych wymogów kompilatora.
EN
Above article is about the issues of constructing digital real-time simulators of electrical systems. A characteristic thing of this type of simulators is the possibility of direct cooperation with physical devices, such as regulators etc. It is expected to obtain the results of numerical computations for a given level of adequacy in a particular time. To allow perform parallel calculations, it is appropriate mathematical models of electric system have to be used. We can achieve this using decomposition of the mathematical models of electrical systems at the simulator design stage. To accelerate calculations it is recommended to use mathematical models of aggregated electrical system elements. In this article we derived the mathematical model of the aggregated linear sample of three-phase element, which is used afterwards in the simulator of linear electrical system sample. Experiment results with the use of digital platform with 6-core processor have been also covered in this paper.
EN
The paper presents possible parallelization of the optimization process of complex lighting systems with the use of the genetic algorithm. The features of modern personal computers and the tools enabling distribution of the computation process among multi-core processors are depicted. The duration of a test task computed on the machines provided with the Intel processors of P4, i5 and i7 types with the use of the tools available in the .NET environment has been investigated.
PL
W artykule przedstawiono przykładowe metody skrócenia czasu realizacji zagadnienia optymalizacyjnego wykorzystującego algorytm genetyczny, za pomocą rozproszenia obliczeń na procesorach wielordzeniowych, stosowanych w komputerach klasy PC. Podczas przygotowywania aplikacji obliczeniowej wykorzystano wbudowane mechanizmy udostępnione w środowisku .NET.
15
Content available 6D SLAM with GPGPU computation
EN
Abstract: The main goal was to improve a state of the art 6D SLAM algorithm with a new GPGPU-based implementation of data registration module. Data registration is based on ICP (Iterative Closest Point) algorithm that is fully implemented in the GPU with NVIDIA FERMI architecture. In our research we focus on mobile robot inspection intervention systems applicable in hazardous environments. The goal is to deliver a complete system capable of being used in real life. In this paper we demonstrate our achievements in the field of on line robot localization and mapping. We demonstrated an experiment in real large environment. We compared two strategies of data alingment - simple ICP and ICP using so called meta scan.
PL
Głównym celem jest artykułu jest usprawnienie algorytmu 6D SLAM za pomocą implementacji modułu rejestracji danych wykorzystującą obliczenia równoległe. Moduł rejestracji danych jest oparty o algorytm ICP (ang. Iterative Closest Point), który został w pełni zaimplementowany w architekturze GPU NVIDIA FERMI. W naszych badaniach koncentrujemy się na mobilnych systemach robotycznych inspekcyjno-interwencyjnych dedykowanych do pracy w niebezpiecznym środowisku. Celem jest opracowanie kompletnego systemu, który może być wykorzystany w realnej aplikacji. W tym artykule przedstawiamy nasze rezultaty w zakresie lokalizacji i budowy mapy w trybie on-line. Przedstawiamy eksperyment w rzeczywistym, rozległym środowisku. Zostały porównane dwie strategie dopasowywania danych, klasyczna oraz wykorzystująca tzw. meta scan.
EN
Newton-Raphson DC analysis of large-scale nonlinear circuits may be an extremely time consuming process even if sparse matrix techniques and bypassing of nonlinear models calculation are used. A slight decrease in the time required for this task may be enabled on multi-core, multithread computers if the calculation of the mathematical models for the nonlinear elements as well as the stamp management of the sparse matrix entries is managed through concurrent processes. In this paper it is shown how the numerical complexity of this problem (and thus its solution time) can be further reduced via the circuit decomposition and parallel solution of blocks taking as a departure point the Bordered-Block Diagonal (BBD) matrix structure. This BBD-parallel approach may give a considerable profit though it is strongly dependent on the system topology. This paper presents a theoretical foundation of the algorithm, its implementation, and numerical complexity analysis in virtue of practical measurements of matrix operations.
EN
In this paper authors present methods that can be used to improve efficiency of solidification process simulations conducted with use of the Finite Elements Method. The properties of many core architecture, such as graphics processors (GPU), are taken into consideration. This paper describes problems related to building system of equations on graphic cards. A two-step method of building the linear equations system for the solidification process was described. This method is designed for a specific properties of graphics processor. The properties that are taken into account are data transfer and graphics card memory size. Using described method to perform simulation of solidification process could decrease time of computation on GPU as well as CPU.
EN
This paper is devoted to the total tardiness minimization scheduling problem, where the efficiency of a processor increases due to its learning. Such problems model real-life settings that occur in the presence of a human learning (industry, manufacturing, management) and in some computer systems. However, the increasing growth of significant achievements in the field of artificial intelligence and machine learning is a premise that the human-like learning will be present in mechanized industrial processes that are controlled or performed by machines as well as in the greater number of multi-agent computer systems. Therefore, the optimization algorithms dedicated in this paper for scheduling problems with learning are not only the answer for present day scheduling problems (where human plays important role), but they are also a step forward to the improvement of self-learning and adapting systems that undeniably will occur in a new future. To solve the analysed problem, we propose parallel computation approaches that are based on NEH, tabu search and simulated annealing algorithms. The numerical analysis confirm high accuracy of these methods and show that the presented approaches significantly decrease running times of simulated annealing and tabu search and also reduce the running times of NEH.
19
Content available remote Parallel computing algorithm for rolling of slabs with semi-solid zone
EN
The paper presents an application of parallel object-oriented programming technique in modeling of rolling of steel plates with semi-solid zone. Due to limitations of available computer resources, a very accurate computation can sometimes be impossible or the time performance can be a barrier for practical application of complex sequential models. Taking advantage of parallel computing the authors have developed an algorithm allowing the computation using multiple processors, which is the main subjects of the presented paper.
PL
W artykule zaprezentowano obiektowo zorientowaną technikę obliczeń równoległych w zastosowaniu do procesu walcowania slabów ze strefą półciekłą. Ze względu na ograniczoną moc komputerów będących do dyspozycji technologów obliczenia wymagające dużej precyzji mogą być niemożliwe lub czas obliczeń staje się barierą w przypadku złożonych modeli sekwencyjnych procesów. Wykorzystując zalety obliczeń równoległych zaproponowano algorytm pozwalający na obliczenia z wykorzystaniem dostępnych procesorów, którego prezentacja stanowi głównym cel artykułu.
20
PL
W artykule zaprezentowano i porównano dwie metody dekompozycji zadania odwrotnego. Obliczenia przeprowadzono na przykładzie wybranych zagadnień z dziedziny geofizyki: lokalizacji współrzędnych hipocentrum wstrząsu górniczego oraz inwersji połączonej danych geoelektrycznych. Do rozwiązania zadania odwrotnego zastosowano algorytmy optymalizacji globalnej z grupy metod przeszukiwania siatki. W przedstawionych przykładach w przypadku obliczeń równoległych zastosowano dwie strategie podziału zadania sekwencyjnego: podział grubo- i drobnoziarnisty. Analizowano czas obliczeń, przyspieszenie i efektywność zaproponowanych schematów dekompozycji.
EN
The article presents two different kinds of parallel decomposition of the inverse problem. The computations were performed on the example of selected issues in the fields of geophysics: the location of mining tremors and the joint inversion of geoelectrical data. Global optimization algorithms from the group the grid search method were used to solve the inverse problem. For a parallel realization of this algorithm the fine and the coarse grid decomposition were proposed. Execution time, speed-up and efficiency of both kinds of parallel algorithms were presented and analyzed.
first rewind previous Strona / 2 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.