Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 76

Liczba wyników na stronie
first rewind previous Strona / 4 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  GPU
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 4 next fast forward last
1
Content available Fenomen sowieckich służb specjalnych
PL
Autor artykułu, analizując fenomen skuteczności sowieckich służb specjalnych, wysuwa hipotezę, że była ona skutkiem splotu kilku czynników. Wśród głównych elementów składających się na niebywałą sprawność służb sowieckich w pierwszej dekadzie po przewrocie październikowym, zdaniem autora znajdują się: fuzja doświadczeń instytucjonalnych Ochrany z wiedzą środowisk kryminalno-rewolucyjnych tworzących WCzK oraz rozwiązania operacyjne niespotykane wśród cywilizowanych społeczeństw. Zdaniem autora, sowieckie służby zostały de facto wyjęte spod prawa i nakazów moralności (uznawanych za przeżytek burżuazyjny), co umożliwiło stosowanie metod i form pracy niemożliwych w Europie Zachodniej. Tak rozumiane instrumentarium sowieckich służb składało się z mieszanki terroru, infiltracji, prowokacji i dezinformacji.
EN
The article author, analyzing the phenomenon of the effectiveness of the Soviet special services, puts forward the hypothesis that it was the result of a combination of several factors. Among the main elements that made up the incredible efficiency of the Soviet services in the first decade after the October coup, according to the author there were: a fusion of institutional experiences of the Okhrana with the knowledge of criminal-revolutionary environments creating the VChK and operational solutions unheard of in civilized societies. According to the author, the Soviet services acted under no law and moral obligations (considered by revolutionaries as bourgeois remnant), which allowed the use of methods and forms of operational work unthinkable in Western Europe. The instruments of the Soviet services consisted of a mixture of terror, infiltration, provocation and disinformation.
2
Content available remote Implementation of numerical integrationto high-order elements on the GPUs
EN
This article presents ways to implement a resource-consuming algorithm on hardware with a limited amount of memory, which is the GPU. Numerical integration for higher-order finite element approximation was chosen as an example algorithm. To perform compu- tational tests, we use a non-linear geometric element and solve the convection-diffusion- reaction problem. For calculations, a Tesla K20m graphics card based on Kepler archi- tecture and Radeon r9 280X based on Tahiti XT architecture were used. The results of computational experiments were compared with the theoretical performance of both GPUs, which allowed an assessment of actual performance. Our research gives sugges- tions for choosing the optimal design of algorithms as well as the right hardware for such a resource-demanding task.
PL
W niniejszym artykule przedstawiono metodę wykorzystania procesorów graficznych do obliczeń wartości poziomów niejonizujących pól elektromagnetycznych, pochodzących od systemów radiokomunikacyjnych, stanowiących potencjalne źródło narażeń ludności na pole elektromagnetyczne. Czasy obliczeń porównano z metodami wykorzystującymi przetwarzanie równoległe na procesorach CPU.
EN
This article presents the method of using GPGPU to estimate EMF levels of human exposure on non-ionized EMF, deriving from wireless systems. Calculation time on GPGPU has been compared to time elapsed with parallel calculations performed on CPU.
4
Content available Wykorzystanie CPU i GPU do obliczeń w Matlabie
PL
W artykule zostały przedstawione wybrane rozwiązania wykorzystujące procesory CPU oraz procesory graficzne GPU do obliczeń w środowisku Matlab. Porównywano różne metody wykonywania obliczeń na CPU, jak i na GPU. Zostały wskazane różnice, wady, zalety oraz skutki stosowania wybranych sposobów obliczeń.
EN
The article presents selected solutions using CPU processors and GPUs for calculations in the Matlab environment. Various methods of performing calculations on the CPU as well as on the GPU were compared. Differences, disadvantages, advantages and effects of using selected calculation methods have been indicated.
EN
Spiking Neural P system is a computing model inspired on how the neurons in a living being are interconnected and exchange information. As a model in embrane computing, it is a non-deterministic and massively-parallel system. The latter makes GPU a good candidate for accelerating the simulation of these models. A matrix representation for systems with and without delay have been previously designed, and algorithms for simulating them with deterministic systems was also developed. So far, non-determinism has been problematic for the design of parallel simulators. In this work, an algorithm for simulating non-deterministic spiking neural P system with delays is presented. In order to study how the simulations get accelerated on a GPU, this algorithm was implemented in CUDA and used to simulate non-uniform and uniform solutions to the Subset Sum problem as a case study. The analysis is completed with a comparison of time and space resources in the GPU of such simulations.
PL
W artykule zaprezentowano praktyczną implementację aplikacji rozwiązującej przykładowy algorytm genetyczny z wykorzystaniem akceleratorów GPU. W tym przypadku zdecydowano się na rozwiązanie za pomocą algorytmu genetycznego typowego problemu optymalizacyjnego, jakim jest problem komiwojażera. Dodatkowo w celu wykorzystania mocy karty graficznej w tworzonej aplikacji wykorzystano technologię programowania na karcie graficznej – technologię Nvidia CUDA.
EN
The paper presents a practical implementation of a local desktop application that solves exemplary genetic algorithm with the use of GPU accelerators. In this case decided with the use of genetic algorithm to solve typical optimization problem which is travelling salesman problem. Additionally used Nvidia CUDA programming technology in order to use power of GPU in created application.
7
Content available remote Electrical supply of aircraft during parking
EN
The elaboration discusses selected aspects of parking supply of aircraft with electricity generated by mobile, airfield sources. In terms of sublime electrical and electronic systems, as well as avionic systems installed on-board of contemporary aircraft, the quality of electricity supplied by ground sources results in their manufacturers facing with high requirements that are contained in relevant standards and regulations. The quality of electricity generated by ground sources and their compatibility have a direct impact, among others, on the calibration of aircraft avionics systems during the ground flight preparation, which directly contributes to the safety of air operations. Therefore, the possibility of constant real-time monitoring of the supplied electricity (specific parameters) enabling immediate identification, recording, adjusting the deviations, hence, preventing damage or improper preparation of an aircraft for flight, becomes a non-trivial issue.
PL
W niniejszym opracowaniu omówiono wybrane aspekty elektrycznego zasilania postojowego statku powietrznego przy użyciu źródeł przenośnych i lotniskowych. Pod względem zaawansowanych systemów elektrycznych i elektronicznych, jak również systemów awionicznych zainstalowanych na pokładzie współczesnego statku powietrznego, jakość elektryczności dostarczanej przez źródła naziemne powoduje, że producenci borykają się z problemem wysokich wymogów zawartych w odpowiednich normach i regulacjach. Jakość elektryczności generowanej przez źródła naziemne oraz ich kompatybilność mają bezpośredni wpływ między innymi na kalibrację systemów awionicznych statku powietrznego podczas przygotowania do lotu, co bezpośrednio przekłada się na bezpieczeństwo operacji powietrznych. Dlatego, możliwość ciągłego monitorowania w czasie rzeczywistym dostarczanej elektryczności (określone parametry) umożliwiającej natychmiastową identyfikację, rejestrację, dostosowywanie odchyleń a co za tym idzie, zapobieganie powstawaniu uszkodzeń oraz nieprawidłowemu przygotowaniu statku powietrznego do lotu, jest kwestią niezwykle istotną.
EN
A robust finite-difference-time-domain (FDTD ) scheme to model the non-linear elastic wave propagation in a homogeneous isotropic material is presented. A formulation based on rotated staggered grid scheme in a displacement-velocity-stress configuration incorporating both geometric and material nonlinearities is proposed. By adopting a Parsimonious algorithm, the computational memory requirement is reduced by 50%. Simulations are accelerated by exploiting massive data parallelism innate to the FDTD approach using parallel computation on Graphical Processing Units with NVIDIA CUDA ’s API. For the proposed numerical scheme, the grid convergence criterion and accuracy over propagating distances are investigated. The study is also extended to determine the contribution from geometric and material models at various input amplitude levels. The time and frequency domain signals obtained from the proposed scheme are verified with a commercial finite element solver. The simulation runtimes for an Aluminium sample of dimensions 20 mm x 10 mm using a 5 MHz pulse is of the order of one minute, which makes the proposed numerical scheme attractive to model nonlinear elastic waves in large domains.
PL
W artykule przedstawiono odporny schemat metody różnic skończonych w dziedzinie czasu (FDTD ) do modelowania propagacji nieliniowych fal sprężystych w jednorodnym materiale izotropowym. Zaproponowano podejście oparte na rotowanych siatkach przestawnych w układzie przemieszczenie- prędkość-naprężenie obejmującym zarówno nieliniowość geometryczną, jak i materiałową. Zastosowanie algorytmu redukcji oszczędnej, zmniejszyło zapotrzebowanie na pamięć obliczeniową o 50%. Symulacje są przyspieszane przez wykorzystanie olbrzymiego paralelizmu danych wbudowanego w podejście FDTD z wykorzystaniem obliczeń równoległych na jednostkach przetwarzania graficznego (GPU) wyposażonych w interfejs API NVIDIA CUDA . Dla proponowanego schematu numerycznego badane jest kryterium zbieżności siatki i dokładność w funkcji odległości propagacji. Badanie rozszerzono również w celu określenia wkładu modeli geometrycznych i materiałowych na różnych poziomach amplitudy wejściowej. Sygnały w dziedzinie czasu i częstotliwości uzyskane z proponowanego schematu są weryfikowane za pomocą komercyjnego oprogramowania wykorzystującego metodę elementów skończonych. Czasy pracy dla symulacji propagacji impulsu o częstotliwości 5 MHz w próbce aluminium o wymiarach 20 mm x 10 mm są rzędu jednej minuty, co sprawia, że proponowany schemat liczbowy jest atrakcyjny dla modelowania nieliniowych fal sprężystych w dużych domenach.
PL
Ultradźwiękowe systemy Phased-Array (PA) umożliwiają detekcję i ocenę wad za pomocą wieloelementowych głowic ze skanowaniem elektronicznym. Zaawansowane metody kierowania wiązki oraz wizualizacji znacznie ułatwiają badania obiektów o skomplikowanej geometrii. Należy jednak pamiętać, że klasyczna metoda PA bazuje na tych samych zasadach fizycznych, co skanowanie standardowymi głowicami jednoelementowymi i posiada te same ograniczenia. W naszym laboratorium pracujemy nad implementacją nowej klasy metod obrazowania UT, które wykorzystują technikę Full-Matrix Capture (FMC) oraz Total Focusing Method (TFM). Metody te dają zupełnie nowe możliwości rekonstrukcji obrazów wad i pozwalają na uzyskanie jednorodnej rozdzielczości poprzecznej w całej głębokości badania. W tym celu zbudowaliśmy demonstrator przenośnego systemu PA wyposażony w funkcje FMC i TFM. Akwizycja pełnej macierzy ech oraz przetwarzanie softwarowe na wbudowanym procesorze GPU (Nvidia® Tegra) zapewniają duże możliwości przetwarzania i analizy sygnałów. Demonstrator jest wyposażony w 32-kanały akwizycji w konfiguracji 32:128 i współpracuje ze standardowymi głowicami PA firmy Olympus®.
EN
Phased-Array (PA) ultrasonic systems enable the detection and evaluation of defects with multi-element electronic scanning heads. Advanced beam steering and visualization make it easy to explore complex geometries. However, it should be remembered that the classic PA method is based on the same physical principles as standard single-element probes and has the very same limitations. In our laboratory we are working on the implementation of a new class of UT imaging methods, namely Full-Matrix Capture (FMC) and Total Focusing Method (TFM) techniques. These methods provide completely new possibilities for the reconstruction of defect images and allow to obtain a uniform lateral resolution throughout the depth of the test. For this purpose, we have built a portable PA system demonstrator equipped with FMC and TFM functions. Acquisition of a full array of echoes and software processing on the built-in GPU (Nvidia® Tegra) provide great opportunities for signal processing and analysis. The demonstrator is equipped with 32 RX channels in a 32:128 configuration and is compatible with standard Olympus® PA probes.
EN
This paper presents an alternative approach to the sequential data classification, based on traditional machine learning algorithms (neural networks, principal component analysis, multivariate Gaussian anomaly detector) and finding the shortest path in a directed acyclic graph, using A* algorithm with a regression-based heuristic. Palm gestures were used as an example of the sequential data and a quadrocopter was the controlled object. The study includes creation of a conceptual model and practical construction of a system using the GPU to ensure the realtime operation. The results present the classification accuracy of chosen gestures and comparison of the computation time between the CPU- and GPU-based solutions.
EN
Automatic text categorization presents many difficulties. Modern algorithms are getting better in extracting meaningful information from human language. However, they often significantly increase complexity of computations. This increased demand for computational capabilities can be facilitated by the usage of hardware accelerators like general purpose graphic cards. In this paper we present a full processing flow for document categorization system. Gram-Schmidt process signatures calculation up to 12 fold decrease in computing time of system components.
PL
Problemy, przed jakimi stają współcześni inżynierowie, wymagają bardzo często przeprowadzenia złożonych symulacji komputerowych rozważanego zjawiska. W zdecydowanej większości takich symulacji wyznaczane są rozkłady różnych wielkości fizycznych, takich jak temperatura, odkształcenia, czy przemieszczenia. Ze względu na dużą złożoność tego rodzaju zadań realizowanie ich na zwykłych procesorach ogólnego przeznaczenia staje się nieefektywne. Coraz częściej inżynierowie sięgają po nowoczesne heterogeniczne układy wielordzeniowe takie jak układy graficzne. Zastosowanie tych rozwiązań sprzętowych pozwala na znaczące przyspieszenie obliczeń. W pracy autor przedstawił komputerową symulację procesu krzepnięcia odlewu w formie odlewniczej z zastosowaniem układów graficznych nVidia zgodnych z architekturą CUDA.
EN
Issues today's faced by engineers require's very often perform complex computer simulations the considered phenomenon. In the great majority of these computer simulations are calculated distributions of various of physical quantities such as temperature, deformations, and displacements. Due to a large complexity of these tasks use the general purpose processors becomes ineffective. More often engineers are reach for the modern many-core heterogeneous systems such as GPUs. Use of these hardware solutions can significantly speed up the computations.In this work the author presents a computer simulation of casting solidification process in the mold using nVidia chipset compatible with the CUDA architecture.
PL
Opisano implementację metody momentów – sztandarowego narzędzia analizy zagadnień inżynierii pola elektromagnetycznego (anteny, kompatybilność EM, mikrofale) – w heterogenicznym środowisku obliczeniowym CPU/GPU niskobudżetowej stacji roboczej typu desktop. Wykazano możliwość znaczącej poprawy wydajności metody dzięki wykorzystaniu zdolności procesora wielordzeniowego i procesorów strumieniowych karty graficznej do przetwarzania równoległego.
EN
Implementation of the Method-of-Moments – as a tool for the analysis of various electromagnetic engineering problems (antennas, electromagnetic compatibility, microwaves) – on a heterogeneous CPU/GPU platform of a typical low-cost desktop workstation is described in the paper. The possibility of attaining noticeable performance improvement of the method by utilizing potential of both the multi-core CPU processor and graphic card for parallel processing is demonstrated.
14
Content available remote Parallel computation of transient processes on OpenCL framework
EN
Parallel execution of calculation of transient analysis is based on a split-level model into sub-systems, which in certain time increments are calculated independently of each other. Each such process has a high computational complexity. The process of implementing the calculation allows the use of parallel systems to calculations based on the use of the GPU, whose dynamic growth has been observed for several years. The article presents a brief description of parallel computing systems based on the OpenCL platform that uses GPUs. There is described the ability to implement the algorithm using this platform. There is also discussed, the timing to perform operations on GPU in relation to the calculations for classic CPU.
PL
Równoległa realizacja obliczeń analizy stanów przejściowych bazuje na podziale na poziomie modelu na pod-układy, które w określonych krokach czasowych obliczane są niezależnie od siebie. Każdy taki proces charakteryzuje się dużą złożonością obliczeniową. Proces realizacji obliczeń pozwala na zastosowanie do obliczeń systemów równoległych opartych o wykorzystanie GPU, których dynamiczny rozwój jest obserwowany od kilku lat. W artykule przedstawiono krótką charakterystykę równoległych systemów obliczeniowych opartych o platformę OpenCL wykorzystującą procesory GPU. Opisano możliwość implementacji algorytmu z wykorzystaniem tej platformy. Omówiono zależności czasowe realizacji obliczeń na procesorach graficznych w stosunku do obliczeń na klasycznych CPU.
15
Content available remote Effectiveness of Fast Fourier Transform implementations on GPU and CPU
EN
In this paper, we present the results of comparison of the effectiveness of selected variants of radix-2 Fast Fourier Transform (FFT) algorithms implemented on both Graphics (GPU) and Central (CPU) Processing Units. The considered algorithms differ in memory consumption and the arrangement of data-flow paths which affects the global memory coalescing and cache memory exploitation. The obtained results allow to indicate the variants of FFT algorithms which are best suited for GPU and CPU architectures, to confirm the advisability of GPU oriented calculations of FFT and to formulate a guideline for implementations of fast algorithms of various linear transforms.
XX
W niniejszej pracy przedstawiono wyniki porównania efektywności wybranych wariantów algorytmów szybkiej transformaty Fouriera (FFT) typu radix-2 realizowanych zarówno dla procesorów graficznych (GPU) jak i typowych jednostek centralnych (CPU). Rozważane algorytmy różnią się zapotrzebowaniem pamięciowym oraz postaciami grafów przepływu danych, które mają wpływ na spójność wykorzystania pamięci globalnej oraz pamięci cache jednostek GPU i CPU. Uzyskane wyniki pozwalają na wskazanie wariantów algorytmów FFT, które są najlepiej dostosowane dla architektur GPU i CPU, pozwalają też potwierdzić celowość realizacji implementacji FFT zorientowanych na wykorzystanie jednostek GPU, a także sformułować ogólne wytyczne dla implementacji zorientowanych na wykorzystanie jednostek GPU algorytmów szybkich przekształceń liniowych.
16
Content available remote Akceleracja metody elementów skończonych przy użyciu procesora graficznego
PL
Artykuł przedstawia rezultaty akceleracji obliczeń metody elementów skończonych z użyciem procesora graficznego. Dzięki zastosowaniu masowo zrównoleglonych obliczeń na procesorze graficznym dwóch najbardziej kosztownych obliczeniowo etapów generacji macierzy współczynników i rozwiązywania układu równań przy użyciu metody gradientów sprzężonych z wielopoziomowym prekondycjonerem o schemacie V udało się pięciokrotnie skrócić czas symulacji metody elementów skończonych.
EN
This paper presents the results of the acceleration of computations involved in the finite element method obtained with graphics processors. A 5-fold acceleration was achieved thanks to the massive parallelization of two most time-consuming steps of the finite element method, namely matrix generation and the solution of sparse system of linear equations with the conjugate gradient method and a V-cycle multilevel preconditioner.
EN
We report on the first application of the graphics processing units (GPUs) accelerated computing technology to improve performance of numerical methods used for the optical characterization of evaporating microdroplets. Single microdroplets of various liquids with different volatility and molecular weight (glycerine, glycols, water, etc.), as well as mixtures of liquids and diverse suspensions evaporate inside the electrodynamic trap under the chosen temperature and composition of atmosphere. The series of scattering patterns recorded from the evaporating microdroplets are processed by fitting complete Mie theory predictions with gradientless lookup table method. We showed that computations on GPUs can be effectively applied to inverse scattering problems. In particular, our technique accelerated calculations of the Mie scattering theory on a single-core processor in a Matlab environment over 800 times and almost 100 times comparing to the corresponding code in C language. Additionally, we overcame problems of the time-consuming data post-processing when some of the parameters (particularly the refractive index) of an investigated liquid are uncertain. Our program allows us to track the parameters characterizing the evaporating droplet nearly simultaneously with the progress of evaporation.
18
Content available remote Particle Effect System for the Needs of a Modern Video Game Using the GPU
EN
A new system of creation and management of particle effects created for the needs of the future productions of Techland Co. Ltd. is presented. By a proper organisation of memory buffers it provides for maximum data density in the memory. This makes it possible to simplify the calculations and to use a smaller number of threads and less memory readings.
19
Content available remote GPU assisted self-collisions of cloths
EN
Nowadays, people expectations about high realism in games are very high and computers have to make a huge effort to compute every simple detail that occurs in a virtual 3D scene. Fortunately, we can use power of Graphics Processing Units (GPU) to compute some part of the most computationally heavy algorithms. In this paper, we present method to accelerate computations on GPU using Compute Shaders based on cloth simulation with self-collisions for big number of cloth’s model vertices (more than 2000).
EN
A Kampmann-Wagner type numerical precipitation model (KWN) has been implemented using NVIDIA's CUDA framework for numerical programming of the graphics processing unit (GPU). Different implementation strategies are discussed and subjected to performance measurements. We study two representative cases corresponding to a large and a small workload. The model is found to be well suited for a GPU implementation, provided that there is enough work to keep the device busy and the right parallelization strategy is chosen. For our hardware, we recommend a minimum work load of more than $2^{16}$ histogram bins (as the total of multiple histograms) which corresponds to 146 histogram bins per GPU core. When the KWN model is used in combination with other calculations that are processed by the CPU, the performance improvements can be such that the KWN model incurs only emph{negligible} additional execution time. Also if the KWN model is used standalone for a large case, the GPU implementation achieves good scalability and performance.
PL
Model Kampmanna-Wagncra dla wydzieleń (KWN) został zaimplementowany za pomocą frameworku NVIDIA CUDA w numerycznym programie dla kart graficznych (GPU). W pracy przedyskutowano różne strategie implementacji i oceniono wydajność poszczególnych rozwiązań. Badano dwa reprezentatywne przypadki odpowiadające małemu i dużemu obciążeniu obliczeniowemu. Zauważono, że model jest odpowiedni dla implementacji GPU, zakładając że obciążenie jest wystarczające aby procesory były obciążone i że wybrana jest odpowiednia strategia zrównoleglenia. Dla urządzeń użytych w pracy zarekomendowano minimalne obciążenie 2"’ histogramów czyli dyskretyzowanych cząstek (jako sumę wszystkich histogramów), co odpowiada 146 histogramów na jedną GPU. Kiedy model KWN jest połączony z innymi obliczeniami prowadzonymi na GPU, poprawa wydajności może być uzyskana dzięki temu że model KWN wykorzystuje tylko niewielką część czasu procesora. Ponadto, jeżeli model KWN jest wykorzystany oddzielnie dla dużego zadania, implementacja GPU osiąga dobrą skalowalność i wydajność.
first rewind previous Strona / 4 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.