On application of heterogeneous hardware architectures based on advanced RISC machines to fem calculations

Bzowski, K.; Rauch, Ł.

Artykuł - szczegóły

Tytuł artykułu

On application of heterogeneous hardware architectures based on advanced RISC machines to fem calculations

Autorzy

Bzowski K. , Rauch Ł.

Wybrane pełne teksty z tego czasopisma

http://www.cmms.agh.edu.pl/

Identyfikatory

Warianty tytułu

Zastosowanie heterogenicznych architektur sprzętowych bazujących na architekturze advanced RISC machines do obliczeń MES

Języki publikacji

Abstrakty

Advanced RISC Machine (ARM) hardware architectures are nowadays one of the most popular solutions among processors widelypresent in mobile and embedded systems. Due to relatively low power consumption and high multithreaded capabilities they can be found in more than 75% 32-bits devices (Frenzel Jr, 2010). Modern ARM processors also contain integrated high efficiency graphics units like Mali T6xx which made them particularly useful for growing market of mobile devices. Mali processors support OpenCL standard which made them valuable for wide range of scientific computing, where processing power is as much important as power consumption. Presented paper contains proof of concept of Finite Element Method (FEM) software capable to compute transient heat transfer analysis and implemented for ARM architecture. Exemplary implementation using OpenCL was prepared. Efficiency data as well as comparison between modern GPGPU, accelerators and ARM devices are included in the paper.

Architektura Advanced RISC Machinę (ARM) jest obecnie jedną z najbardziej popularnych rozwiązań wśród procesorów mobilnych i systemów wbudowanych. W związku ze znacznie mniejszym zużyciem energii elektrycznej i wysoką wielowątkowością znalazły one zastosowanie w ponad 75% obecnie stosowanych systemów 32-bitowych (Frenzel Jr, 2010). Nowoczesne procesory ARM zawierają często zintegrowane jednostki graficzne wysokiej wydajności, takie jak Mali T6xx, co sprawia że stały się one szczególnie użyteczne dla dynamicznie rozwijającego się rynku urządzeń mobilnych. Procesory z rodziny Mali T6xx wspierają standard OpenCL, co powoduje, że mogą one również zostać wykorzystane w szerokiej gamie obliczeń naukowych, w których moc obliczeniowa jest tak samo istotna jak oszczędność energii. W artykule przedstawiono koncepcję oprogramowania wykorzystującego metodę elementów skończonych do obliczeń niestacjonarnych przepływów ciepła z wykorzystaniem architektury obliczeniowej ARM. Przedstawiono przykładową implementację z wykorzystaniem technologii OpenCL, jak również wykonano testy porównawcze z nowoczesnymi architekturami GPGPU oraz analizy energetyczne.

Słowa kluczowe

heterogeneous computing GPGPU ARM finite element method

Wydawca

Wydawnictwa AGH

Czasopismo

Computer Methods in Materials Science

Rocznik

2015

Tom

Vol. 15, No.3

Strony

435--440

Opis fizyczny

Bibliogr. 11 poz., rys.

Twórcy

autor

Bzowski K.

kbzowski@agh.edu.pl

AGH- University of Science and Technology, Mickiewicza 30, 30-059 Kraków, Poland

autor

Rauch Ł.

AGH- University of Science and Technology, Mickiewicza 30, 30-059 Kraków, Poland

Bibliografia

Abdurachmanov, D., Elmer, P., Eulisse, G., Muzaffar, S., 2014b, Initial explorations of ARM processors for scientific computing, Journal of Physics Conference Series, 523, 1-6.
Bientinesi, P., Herrero, J.R., Quintana-Orti, E.S., Strzodka, R., 2015, Parallel computing on graphics processing units and heterogeneous platforms, Concurrency and Compu¬tation: Practice and Experience, 21, 1525-1527.
Frenzel Jr, L.E., 2010, Chapter 6 - How Microcomputers Work: The Brains of Every Electronic Product Today, Electronics Explained, ed. Frenzel, L.E., Newnes, Boston, 123-145.
Grasso, I., Radojkovic, P., Rajovic, N., Gelado, I., Ramirez, A., 2014, Energy Efficient HPC on Embedded SoCs: Optimization Techniques for Mali GPU, Proc. Conf. Parallel and Distributed Processing Symposium, 2014 IEEE 28th International, 123-132.
Kreutzer, M., Hager, G, Wellein, G., Fehske, H., Bishop, A.R., 2014, A unified sparse matrix data format for efficient general sparse matrix-vector multiply on modem processors with wide SIMD units, ArXiv e-prints, available online at http: arxiv.org pdf 1307.6209v2.pdf. accessed: 12.10.2015.
Kruze, F., Banas, K., 2014, Finite Element Numerical Integration on Xeon Phi coprocessor, eds. Ganzha, M, Maciaszek, L., Paprzycki, M., Proc. Conf. Federated Conference on Computer Science and Information Systems, Lodz, 603-612.
Rajovic, N., Rico, A., Puzovic, N., Adeniyi-Jones, C, Ramirez, A., 2014, Tibidabo: Making the case for an ARM-based FLPC system, Future Generation Computer Systems, 36, 322-334.
Rauch, L., 2013, Heterogeneous Hardware Implementation of Molecular Static Method for Modelling of Interatomic Behaviour, Procedia Computer Science, 18, 1057-1067.
Rauch, L., Bzowski, K., Rodzaj, A., 2012, OpenCL Implementation of Cellular Automata Finite Element (CAFE) Method, Parallel Processing and Applied Mathematics, eds. Wyrzykowski, R., Dongarra, J., Karczewski, K., Waśniewski, J., Springer Berlin Heidelberg, 381-390.
Rodero, I., Parashar, M., 2012, Energy Efficiency in HPC Systems, Energy-Efficient Distributed Computing Systems, John Wiley & Sons, Inc., 81-108.
Rupp, K., Rudolf, F., Weinbub, J., 2010, ViennaCL - A High Level Linear Algebra Library for GPUs and Multi-Core CPUs, eds. Mehofer, E., Schordan, M., Quinlan, D., Di Martino, B., Proc. Conf. International Workshop on GPUs and Scientific Applications (GPUScA 2010), 51-56.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-195df818-5adb-4eab-94c8-34a483be7529