Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 57

Liczba wyników na stronie
first rewind previous Strona / 3 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  GPGPU
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 3 next fast forward last
PL
W artykule przedstawiono numeryczną analizę nieustalonego pola temperatury w trójwymiarowym modelu elektrycznego grzejnika podłogowego. Sformułowano odpowiednie zagadnienie brzegowo-początkowe, które dyskretyzowano niejawną metodą różnic skończonych. Otrzymane układy równań rozwiązano przy wykorzystaniu metody BiCGStab i procesora GPU. Dodatkowe zastosowanie procesora GPU pozwoliło ponad 5-krotnie skrócić czas obliczeń w stosunku do programu pracującego tylko na procesorze CPU.
EN
This paper presents the numerical analysis of the transient temperature field in a three-dimensional model of an electric floor heater. An appropriate initial-boundary value problem was formulated, which was discretised using the implicit finite difference method. Obtained systems of equations were solved using the BiCGStab method and the GPU. The additional application of the GPU reduced the time of computations over 5 times compared to the program executed only on the CPU.
EN
The article presents the assumptions and architectural implementation of a cargo transport control support system, as well as the preliminary results of tests of the operation of this system in environmental conditions identical with the conditions of natural operation.The aim of the article is the publication of the research results collected during the design, implementation and operation of the system, which relate to the proposed solutions for selected problems that emerged during the development of the system by the research and development team. The article also presents the completed development work and possibilities in the field of the system improvement due to security reasons through integration with modern data processing systems based on a block chain (Blockchain).
EN
We parallelized the sequential algorithm of the four-body correlation function if eachcombination of two pairs(i, j)and(k, l) was averaged over the time in a separate calculation thread. The generator of pairs used as the input for this algorithm was also parallelized and connected with the 4-body correlation function calculations. We used our algorithm to accelerate extremely intensive calculations of the 4-body polarizability anisotropy correlation functions,which were very important to estimate the interaction induced light scattering spectrum. The resulting C code was used to test our algorithm on Graphics Processing Units (GPUs) with the Compute Unified Device Architecture (CUDA) technology from NVIDIA®Corporation. Asa result, we achieved 12 times the acceleration of the 4-body correlation function calculations in comparison to the Central Processing Unit (CPU) core. The peak performance of the GPU calculations was registered at the level of 19 times faster than the CPU core. We also found thatacceleration depended on the memory consumption. In the single precision mode, the relative error between the CPU and GPU calculations was found to be within 0.1%
PL
W niniejszym artykule przedstawiono metodę wykorzystania procesorów graficznych do obliczeń wartości poziomów niejonizujących pól elektromagnetycznych, pochodzących od systemów radiokomunikacyjnych, stanowiących potencjalne źródło narażeń ludności na pole elektromagnetyczne. Czasy obliczeń porównano z metodami wykorzystującymi przetwarzanie równoległe na procesorach CPU.
EN
This article presents the method of using GPGPU to estimate EMF levels of human exposure on non-ionized EMF, deriving from wireless systems. Calculation time on GPGPU has been compared to time elapsed with parallel calculations performed on CPU.
EN
The paper presents the development of the GPU-based discrete element method (DEM) code for simulating damage and fracture of cohesive solids with application to reinforced concrete at the scale of reinforcement ribs. The solid volume of concrete and steel is modelled by bonded spherical particles. Very fine discretization, containing more than million particles, is applied to describe the 3D reinforcement bar geometry at the scale of ribs and to investigate cracking behaviour of concrete near the reinforcement bar. The numerical model is validated by using experimental results of the double pull-out test. Influence of the discretization scale to the numerical solution is evaluated by using the reinforcement strain profiles and the cracking patterns. The developed GPU-based DEM algorithm efficiently handles interaction of particles, does not require any atomic operation and allows performing fast damage and fracture simulations with large number of particles. The performance measured on GPU is compared with that attained on different CPUs for varying number of particles. The high value of the Cundall number (particle number multiplied by time steps computed per second) equal to 4.3E+07 is measured on NVIDIA® Tesla™ P100 GPU in the case of 1858560 particles.
EN
This paper will show a comparison between the Kepler, Maxwell and Pascal GPU architectures using CUDA-Fortran, with and without dynamic calls, to efficiently solve partial differential equations. The target is to show the possibility of using affordable hardware, such astheGTX670,GTX970 andGTX1080 NVIDIA GPUs, which are commonly found in personal and portable computers, for scientific applications. For simplicity we consider a standard wave equation where we use a second order finite difference method for the spatial and time discretizations to obtain the numerical solution. We found that, as we increase the spatialre solution of the domain we also increase the performance difference between the GPU and the Central Processing Unit (CPU).
EN
This paper addresses the problem of efficient searching for Nonlinear Feedback Shift Registers (NLFSRs) with a guaranteed full period. The maximum possible period for an n-bit NLFSR is 2ⁿ - 1 (an all-zero state is omitted). A multi-stages hybrid algorithm which utilizes Graphics Processor Units (GPU) power was developed for processing data-parallel throughput computation. Usage of the abovementioned algorithm allows giving an extended list of n-bit NLFSR with maximum period for 7 cryptographically applicable types of feedback functions.
PL
Zapotrzebowanie na możliwości obliczeniowe nieustannie wzrasta w wielu dziedzinach wiedzy. Dotyczy to również działów, które wcześniej uznawane były za niewymagające obliczeniowo. Szczególną odpowiedzią jest technologia superkomputerów, których liczba dynamicznie zwiększa się. Możliwość rozwoju poszczególnych dziedzin może zostać w znacznym stopniu ułatwiona dzięki rozwojowi technologii Obliczeń Ogólnego Przeznaczenia z użyciem typowych graficznych procesorów masowo równoległych. W artykule zawarto kompletny opis budowy superkomputera w architekturze węzłowej, wraz z opisem problemów związanych z praktyczną implementacją.
EN
Nowadays computational demands are rapidly growing in many scientific areas. This also applies to engineering branches that were previously considered as not very computationally demanding. The answer is supercomputer technology, the number of which is dynamically increasing. Attention should be given to supercomputers, with General Purpose Graphical Processing Unit technology. Such coprocessor could easily enhance computational power in many scientific areas of interest. The paper describes node architecture of supercomputer with description of practical implementation problems.
EN
We describe a GPGPU–based Monte Carlo simulator integrated with Prism. It supports Markov chains with discrete or continuous time and a subset of properties expressible in PCTL, CSL and their variants extended with rewards. The simulator allows an automated statistical verification of results obtained using Prism’s formal methods.
PL
Zrealizowano implementację algorytmiczną modelu symulującego funkcjonowanie dwóch elementów systemu elektroenergetycznego korzystając z kart graficznych (GPU, Graphics Processing Unit) działających w środowisku wykonawczym C++ AMP (Accelerated Massive Parallelism). Umożliwiło to zwiększenie wydajności obliczeniowej dzięki równoległemu wykorzystaniu kilkuset rdzeni GPU w porównaniu do wykorzystania kilku rdzeni centralnej jednostki obliczeniowej (CPU, Central Processing Unit). Podano wyniki testowania modelu symulacyjnego.
EN
An algorithmic simulation model of operation for two elements of a power system with the usage of the graphics processing unit (GPU) based on the C++ AMP is implemented. It allows to increase the performance of calculations by the parallel use of several hundred GPU cores compared with several cores of central processing unit (CPU). The test results for the simulation model are presented.
11
EN
The embedded systems are increasingly becoming a key technological component of all kinds of complex technical systems and an exhaustive analysis of the state of the art of all current performance with respect to architectures, design methodologies, test and applications could be very interesting. The Advanced Encryption Standard (AES), based on the well-known algorithm Rijndael, is designed to be easily implemented in hardware and software platforms. General purpose computing on graphics processing unit (GPGPU) is an alternative to recongurable accelerators based on FPGA devices. This paper presents a direct comparison between FPGA and GPU used as accelerators for the AES cipher. The results achieved on both platforms and their analysis has been compared to several others in order to establish which device is best at playing the role of hardware accelerator by each solution showing interesting considerations in terms of throughput, speedup factor, and resource usage. This analysis suggests that, while hardware design on FPGA remains the natural choice for consumer-product design, GPUs are nowadays the preferable choice for PC based accelerators, especially when the processing routines are highly parallelizable.
EN
Two models of side thermal insulation (adiabatic and lossy) were examined in the analysis of the operation of electrical floor heater. Temperature field distributions obtained in both cases were compared. Computation costs of consideration of edge effects resulted from insulation lossiness were estimated. The use of parallel operation of a traditional processor (CPU) and a graphics processing unit (GPU) enabled a significant reduction of the computation time.
PL
W analizie pracy elektrycznego grzejnika podłogowego rozpatrywano dwa modele bocznej izolacji termicznej (idealnej i rzeczywistej). Porównano rozkłady pola temperatury wyznaczone w wymienionych przypadkach. Oszacowano obliczeniowe koszty uwzględnienia efektów krawędziowych spowodowanych stratnością izolacji. Zastosowanie równoległej pracy tradycyjnego procesora (CPU) oraz procesora karty graficznej (GPU) umożliwiło znaczne skrócenie czasu obliczeń numerycznych.
EN
Coal gasification is recognized as one of clean coal technologies. Though it has been known for a relatively long time, its complexity still challenges scientists all over the world. One of the tools used in the research is simulation. The presented work investigates the capabilities of using GPGPU in modeling coal gasification. The selected set of models is used (volumetric, non-reactive core and Johnson’s). The models as well as numeric solution methods were implemented as a sequential and parallel code. The execution time for both methods was investigated and the speedup for the parallel code determined. The influence of mathematical function call in the GPU code was also checked. The results show that for all models the parallel code gives significant speedup over the serial counterpart, as long as a reasonably large equation set is used. Therefore, using a dedicated GPU code for coal gasification simulations is highly recommended, whenever big systems of ODE have to be solved.
PL
Gazyfikacja węgla uznawana jest za jedną z tzw. czystych technologii węglowych. Chociaż jest znana już względnie długo, jej złożoność wciąż pozostaje wyzwaniem dla naukowców na całym świecie. Jednym z narzędzi używanych w badaniach jest symulacja. W pracy zbadano możliwości użycia GPGPU w modelowaniu gazyfikacji węgla. Użyto wybranego zbioru modeli (objętościowego, rdzenia bezreaktacyjnego i Johnsona). Modele oraz metody rozwiązań numerycznych zaimplementowano, jako kod szeregowy i równoległy. Zbadano czas realizacji obydwu metod oraz określono przyspieszenie kodu równoległego. Sprawdzono również wpływ wywołania funkcji matematycznej w kodzie GPU. Wyniki wskazują, że dla wszystkich modeli kod równoległy powoduje znaczne przyspieszenie obliczeń w stosunku do odpowiednika szeregowego, pod warunkiem, że użyje się wystarczająco dużego zbioru równań. Dlatego zaleca się użycie dedykowanego kodu GPU do symulacji gazyfikacji węgla w każdym przypadku, gdy wymagane jest rozwiązanie dużych systemów ODE.
EN
This paper presents in-depth the parallel computer algorithm for the determination of characteristic polynomial realisations of dynamic system. The main differences between the depicted method and other state of- the-art solutions include finding not few realisations, but a whole set, and the fact that the found realisations are always minimal among all possible. As digraphsbuilding methods used in the algorithm are NP-complete or NP-hard problems, the algorithm is paralleled and GPGPU (General-Purpose computing on Graphics Processor Units) computation is proposed as the only feasible solution. The article describes in detail the proposed method, discusses it’s complexity, presents optimisation solutions and still open problems. The working algorithm is illustrated with a numerical example and compared to results of other known methods.
15
Content available remote GPU assisted self-collisions of cloths
EN
Nowadays, people expectations about high realism in games are very high and computers have to make a huge effort to compute every simple detail that occurs in a virtual 3D scene. Fortunately, we can use power of Graphics Processing Units (GPU) to compute some part of the most computationally heavy algorithms. In this paper, we present method to accelerate computations on GPU using Compute Shaders based on cloth simulation with self-collisions for big number of cloth’s model vertices (more than 2000).
EN
In this study, we present a practical implementation of prestack Kirchhoff time migration (PSTM) on a general purpose graphic processing unit. First, we consider the three main optimizations of the PSTM GPU code, i.e., designing a configuration based on a reasonable execution, using the texture memory for velocity interpolation, and the application of an intrinsic function in device code. This approach can achieve a speedup of nearly 45 times on a NVIDIA GTX 680 GPU compared with CPU code when a larger imaging space is used, where the PSTM output is a common reflection point that is gathered as I[nx][ny][nh][nt] in matrix format. However, this method requires more memory space so the limited imaging space cannot fully exploit the GPU sources. To overcome this problem, we designed a PSTM scheme with multi-GPUs for imaging different seismic data on different GPUs using an offset value. This process can achieve the peak speedup of GPU PSTM code and it greatly increases the efficiency of the calculations, but without changing the imaging result.
PL
W artykule przedstawiono równoległą metodę obliczania niestacjonarnego pola temperatury elektrycznego grzejnika podłogowego sterowanego regulatorem dwupołożeniowym. Dwuwymiarowe równanie przewodnictwa cieplnego, opisujące rozkład pola temperatury w grzejniku, zdyskretyzowano niejawną metodą różnic skończonych. Do rozwiązania otrzymanego układu równań zastosowano metodę BiCGStab z prekondycjonerem Jacobiego. Algorytm powyższej metody zaimplementowano na procesor karty graficznej.
EN
The article presents a parallel method of computing the non-stationary temperature field of an electric floor heater regulated by an on/off controller. A two-dimensional heat equation, which describes a temperature field distribution in the heater, was discretized with the use of the implicit finite difference method. In order to solve the obtained system of equations, the BiCGStab method with the Jacobi preconditioner was used. The algorithm of this method was implemented on a graphics processing unit.
EN
The article discusses possibilities of implementing a neural network in a parallel way. The issues of implementation are illustrated with the example of the non-linear neural network. Parallel implementation of earlier mentioned neural network is written with the use of OpenCL library, which is a representative of software supporting general-purpose computing on graphics processor units (GPGPU). The obtained results demonstrate that some group of algorithms can be computed faster if they are implemented in a parallel way and run on a multi-core processor (CPU) or a graphics processing unit (GPU). In case of the GPU, the implemented algorithm should be divided into many threads in order to perform computations faster than on a multi-core CPU. In general, computations on a GPU should be performed when there is a need to process a large amount of data with the use of algorithm which is very well suited to parallel implementation.
EN
Advanced RISC Machine (ARM) hardware architectures are nowadays one of the most popular solutions among processors widelypresent in mobile and embedded systems. Due to relatively low power consumption and high multithreaded capabilities they can be found in more than 75% 32-bits devices (Frenzel Jr, 2010). Modern ARM processors also contain integrated high efficiency graphics units like Mali T6xx which made them particularly useful for growing market of mobile devices. Mali processors support OpenCL standard which made them valuable for wide range of scientific computing, where processing power is as much important as power consumption. Presented paper contains proof of concept of Finite Element Method (FEM) software capable to compute transient heat transfer analysis and implemented for ARM architecture. Exemplary implementation using OpenCL was prepared. Efficiency data as well as comparison between modern GPGPU, accelerators and ARM devices are included in the paper.
PL
Architektura Advanced RISC Machinę (ARM) jest obecnie jedną z najbardziej popularnych rozwiązań wśród procesorów mobilnych i systemów wbudowanych. W związku ze znacznie mniejszym zużyciem energii elektrycznej i wysoką wielowątkowością znalazły one zastosowanie w ponad 75% obecnie stosowanych systemów 32-bitowych (Frenzel Jr, 2010). Nowoczesne procesory ARM zawierają często zintegrowane jednostki graficzne wysokiej wydajności, takie jak Mali T6xx, co sprawia że stały się one szczególnie użyteczne dla dynamicznie rozwijającego się rynku urządzeń mobilnych. Procesory z rodziny Mali T6xx wspierają standard OpenCL, co powoduje, że mogą one również zostać wykorzystane w szerokiej gamie obliczeń naukowych, w których moc obliczeniowa jest tak samo istotna jak oszczędność energii. W artykule przedstawiono koncepcję oprogramowania wykorzystującego metodę elementów skończonych do obliczeń niestacjonarnych przepływów ciepła z wykorzystaniem architektury obliczeniowej ARM. Przedstawiono przykładową implementację z wykorzystaniem technologii OpenCL, jak również wykonano testy porównawcze z nowoczesnymi architekturami GPGPU oraz analizy energetyczne.
PL
W artykule przedstawiono metodę symulowania topnienia obiektów zbudowanych z lodu, implementowaną przy wykorzystaniu możliwości obliczeniowych nowoczesnych procesorów graficznych (GPU). Proces topnienia zrealizowano jako rezultat wymiany ciepła pomiędzy obiektami lodowymi i płynami (woda i powietrze), modelowanymi jako zbiory ruchomych cząstek o określonych parametrach fizycznych. Do obliczenia ruchu cząstek wykorzystano wariant algorytmu SPH. Zaprezentowano nowy cząstkowy model powietrza, który pozwala m.in. na uwzględnienie w symulacji lokalnych zmian temperatury powietrza w czasie. Otrzymywane wyniki symulacji są bardziej realistyczne z punktu widzenia poprawności fizycznej i końcowego efektu wizualnego, aniżeli rezultaty otrzymywane przy użyciu metod poprzednich.
EN
The paper presents a fast GPU-based approach to simulation of melting ice objects at interactive frame rates. Our main contribution is a new particlebased model of air which allows one to take into account in simulation the effects of local changes in the air temperature. The process of melting is realized as heat transfer between ice and fluids (water and air), which are represented by means of sets of movable particles (Fig. 2). To convert the triangle-mesh representation of solids into particles, we use a GPU-based voxelization method [4]. Each particle carries some physical local properties of fluid, and their evolution over time is described by the Navier-Stokes equation for incompressible fluids. In order to solve the equation, we utilize a modified version of Smoothed Particle Hydrodynamics (SPH) method [6]. Then, triangle meshes of solids are extracted from the particle representation using marching cubes algorithm, and visualized via ray tracing. Thanks to the new model of air, the results of ice melting supplied by our method (Fig. 3) are more realistic from the standpoint of physical correctness as well as visual appearance than those obtained with the previous approaches.
first rewind previous Strona / 3 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.