Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 2

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  komputery dużej mocy
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
W pracy zaprezentowano wyniki symulacji numerycznej krzepnięcia. Prezentowany model obliczeniowy zbudowany jest na podstawie równania przewodzenia ciepła z członem źródłowym w jawnym sformułowaniu pojemnościowym. Model narastania fazy stałej jest zgodny z pośrednim modelem, w którym zakładana jest skończona dyfuzja domieszki w fazie ciekłej oraz brak dyfuzji domieszki w fazie stałej. Wynikające z modelu równania różniczkowe rozwiązane są za pomocą metody elementów skończonych. Obliczenia były realizowane na komputerach o pamięci rozproszonej. Wykonano testy dla siatek elementów skończonych składających się z maksymalnie 25 milionów elementów. Testy skalowalności były przeprowadzone dla maksymalnie 2048 procesorów.
EN
The results of numerical simulations are presented in this paper. Computational model presented in this work uses heat transfer equation with heat source term in explicit enthalpy formulation. An indirect model for a solid phase growth was used. The indirect model assumes finite diffusion of inclusion in liquid phase and no diffusion in solid state. Resulting differential equations are solved with use of Bubnov-Galerkin Finite Element Method (space discretization). The calculations were performed on computer cluster with distributed memory positioned 7th on TOP500 list from November 2014. We carried out tests using meshes of up to 25 million of tetrahedral elements. The scalability tests were conducted for up to 2048 processor cores.
PL
W artykule przedstawione zostały wyniki implementacji modułu obliczającego część eksponencjalną orbitalu atomowego (funkcję jednoelektoronową). Generowanie funkcji jednoelektrodowych jest jednym z najbardziej wymagających obliczeniowo fragmentów procedury DFT. Dlatego autorzy pracy postanowili wykorzystać układy FPGA do akceleracji wspomnianego algorytmu. Moduł sprzętowy został zaimplementowany na platformie SGI RASC w układzie FPGA serii Virtex-4 LX200. Składa się on z szeregu jednostek zmiennoprzecinkowych zaprojektowanych tak, by mogły pracować w sposób potokowy z częstotliwością sięgającą 200 MHz. Wstępnie przeprowadzone testy wykazały, że uzyskuje się przyspieszenie rzędu 5x względem analogicznych obliczeń prowadzonych na procesorze Intel Itanium 2 1.6 GHz. Należy zaznaczyć, że uzyskiwane przyspieszanie jest limitowane przez ograniczenia platformy (szerokości interfejsu komunikacyjnego).
EN
This paper presents an FPGA implementation of a finite sum of the exponential products (orbital function) calculation module. The module is composed of several units. All of them are specially designed, fully pipelined floating-point modules optimized for high speed performance, up to 200 MHz. Execution results revealed speed-up of 5x for the finite sum of the exponential products comparing to Intel Itanium 2 1.6 processor. Orbital function is a computationally critical part of the Hartree-Fock algorithm. Therefore an approach presented here aims to increase the performance of the whole quantum chemistry computational system by extending it with FPGA-based accelerator which is composed of two Xilinx Virtex-4 LX200 chips. It is worth underlining that achieved speed-up is limited by an external memory width constrain. Thus it can be expected that in foreseeable future introduction of next generation of FPGA-based accelerators will allow to increase the speed-up by just porting a project to them without adoption of any changes in the module's architecture.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.