Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!

Znaleziono wyników: 4

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  graphics processors
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
Artykuł poświęcony jest wykorzystaniu architektury obliczeniowej CUDA, jako efektywnego narzędzia do cyfrowego przetwarzania sygnałów. Analiza zdolności obliczeniowych architektury CUDA zrealizowana została w oparciu o bank filtrów cyfrowych zaimplementowany z wykorzystaniem języka programowania CUDA C/C++. Przedstawione zostały założenia oraz wyniki badań programu realizującego filtrację. Opisane zostały również zastosowane metody, które wpłynęły na zwiększenie wydajności zaimplementowanego programu.
EN
The article describes the use of CUDA computing architecture, as an effective tool for digital signal processing. The analysis of capabilities of CUDA architecture was realized on the basis of a bank of digital filters implemented using the programming language CUDA C/C ++. In this article were presented assumptions and the results of a program that performs filtration. There were also described methods that increased the efficiency of the implemented program.
EN
This paper describes the influence of the varying computation precision when performing calculations using the optimizing algorithms. A comparative analysis of the computation speed and obtained result accuracy of the Rastrigin’s direct cone method with adapting of the step length and the angle of the cone's disclosure for varying precision was performed. It is shown that the speed of the optimization algorithm practically does not depend on used computation precision. The difference is observed only in accuracy of the obtained results. The investigation of optimizing algorithms behavior under the presence of noise, in particular due to rounding errors was conducted. It is shown that the optimizing algorithm under research becomes unsuitable after some noise level. Characteristics of the optimization algorithm during calculations with a single precision proved to be better then the characteristics of the algorithm when performing calculations with double precision. The analysis of possibilities of the effective graphics processors (GPU) application in order to conduct optimization was carried out. In particular, the difference in the speed of the GPU when performing calculations with a single and double precision was considered. To ensure the efficiency of calculations based on optimization algorithms, it is recommended to carry out calculations with the use of single precision, and increase the calculation precision in case of impossibility to achieve the desired accuracy of the result. There is considering the significantly higher performance of graphics processors when doing calculations with a single precision in comparison with calculations with double precision it is expedient to use a single calculation precision when graphic processors are used to solve considered problem. Double precision can be used if it is difficult to get sufficiently correct solution by single precision calculations. The results of numerical experiments confirm that the use of lower precision to perform optimization for macromodels creation has a slight influence on the speed of achieving of predetermined optimization accuracy.
PL
Uzyskane wyniki wykazują spadek czasu wykonania badanej operacji w przypadku obliczeń realizowanych z zastosowaniem procesorów graficznych. Przedstawione w pracy rezultaty badań pozwalają zaobserwować, że zastosowanie procesorów graficznych w znaczacym stopniu redukuje czas wykonywanych obliczeń. Na podstawie zaprezentowanych wyników można zauważyć, że zastosowanie układów graficznych w symulacjach inżynierskich pozwoli na zmniejszenie nakładów czasowych wymaganych w przypadku procesorów CPU dla tego typu zadań. Przeprowadzone badania pozwalają stwierdzić, że procesory graficzne zastosowane w symulacjach inżynierskich mogą przynieść wymierne korzyści. Badane zagadnienie w znaczącym stopniu spełnia specyficzny sposób przetwarzania danych wykorzystany w przypadku procesorów graficznych (ang. Data Stream Processing). Bardzo dużą ilość danych jest przetwarzana zestawem takich samym instrukcji, jednocześnie nie występuje stosowanie mechanizmów synchronizacji, które mają negatywny wpływ na wydajność. Zastosowanie procesorów wielordzeniowych w symulacjach wykorzystujących metodę elementów skończonych pozwala na zwiększanie liczby niewiadomych w układzie równań poprzez podział obszaru na wiekszą liczbę elementów skończonych bez zwiększania czasu obliczeń. Zastosowanie elementów skończonych o mniejszym rozmiarze ma wpływ na zwiększenie dokładności otrzymanego rozwiązania. Wykorzystanie procesorów obliczeń TESLA pozwala nie tylko zmniejszyć czas obliczeń, ale również jednocześnie zminimalizowac koszt zakupu sprzętu oferującego pożądaną moc obliczeniową. Dyskusyjna jest kwestia kosztów rozwoju oprogramowania na jednak dosyć specyficzną architekturę sprzetową.
EN
This paper presents the results of research concerning a sequential and parallel implementation of a global (for the whole analysed region) stiffness matrix used in the finite elements method. The simulations were executed on various hardware and software platforms. The parallel calculations were made on AMD and Intel multicore processors (CPUs), as well as on the TESLA C1060 and nVidia GeForce GTX 260 GPUs. The research results presented in this paper include matrix build times and the rate of performance for programs operating on various platforms. The application was implemented on the CPUs using the C++ language (sequential version) and C++ in conjunction with openMP interface (parallel version). The GPU version was built using CUDA v2.2. The simulations were conducted for the issue of linear elasticity for 2D areas. Calculations were made for finite element meshes of various sizes, ranging from several dozen to several thousand nodes. Comparative results were obtained in a 64-bit Linux environment (Archlinux x64.) The paper presents the architecture of graphics systems and the data processing model used in graphics processors, as well as the method of building a global stiffness matrix. The last part of the paper presents the results of the conducted simulations and the conclusions drawn from those results.
PL
W artykule przedstawiono architekturę procesorów graficznych z serii 8 firmy nVidia oraz technologię CUDA. Zaprezentowano przykładowe metody realizacji wybranych równoległych algorytmów mnożenia macierzy (gęstych oraz rzadkich) z wykorzystaniem graficznych jednostek przetwarzających. Przeprowadzono analizę porównawczą wyników uzyskanych dla procesorów ogólnego przeznaczenia oraz procesorów graficznych.
EN
In this paper we present the architecture of nVidia 8-series graphics processors and the CUDA technology. Exemplary methods of implementing parallel matrices (sparse and dense) multiplication algorithms on Graphics Processing Unit are described. The paper also presents a comparative analysis of the achieved results with the results of computations on general processing units.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.