Tytuł artykułu
Autorzy
Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
Efektywny transfer obiektów języka C+4 na koprocesorze Intel Xeon Phi w trybie offload
Języki publikacji
Abstrakty
Intel Xeon Phi KNC is a modern coprocessor designed for the high performance computing. In this paper we describe efficient method for transferring C++ objects in the Offloading mode. Our aim is to get consistent interface with NVidia CUDA framework in Template Numerical Library (TNL). As working example we use this library and the heat equation problem to demonstrate efficiency of implementation on Intel Xeon Phi and compare CPU with this coprocessor.
Intel Xeon Phi jest nowoczesnym koprocesorem prze naczonym do obliczeń wysokiej wydajności w dużej mierze podobnym do układów GPU NVidia. TNL (Template Numerical Library) jest biblioteką dostarczającą abstrakcyjną warstwę umożliwiającą dostęp do wielordzeniowych procesorów' CPU i GPU przez solwery numeryczne. Naszym celem jest stworzerzenie interfejsu dla koprocesora Intel Xeon Phi zgodnego z Nvic CUDA w TNL. W pracy przedstawiono wydajną metodę kopiowania bitowego obiektów języka C++, podobną do tej zaimplementowanej w NVidia CUDA z wykorzystaniem rozszerzerzenia offload języka C++. Jako przykład wykorzystano rozwiązanie problemu przewodzenia cieplnego w celu demonstracji efektywności implementacji opartej o Intel Xeon Phi Knights Comer oraz porównanie obliczeń CPU z koprocesorem.
Słowa kluczowe
Wydawca
Czasopismo
Rocznik
Tom
Strony
94--100
Opis fizyczny
Bibliogr. 6 poz., rys.
Twórcy
autor
- Department of Mathematics, Faculty of Nuclear Sciences and Physical Engineering, Czech Technical University in Prague
autor
- Department of Mathematics, Faculty of Nuclear Sciences and Physical Engineering, Czech Technical University in Prague
Bibliografia
- Davis, K. D. (22. 9 2013). Effective Use of the Intel Compiler's Offload Features. Accessed: 30. 9 2016, Available form:Intel Developer Zone: https://software.intel.com/en-us/articles/effective-use-of-the-intel-compilersoffload-features
- Chris J. Newburn, R. D. (8. 2 2013). Offload Compiler Runtime for the Intel® Xeon Phi™ Coprocessor. Accessed: 11.10 2016, Available form: Intel Developer Zone:https://software.intel.com/sites/default/files/article/366893/offload-runtime-for-the-intelr-xeon-phitmcoprocessor.pdf
- Chrysos, G. (12. 11 2012). Intel® Xeon Phi™ X100 Family Coprocessor - the Architecture. Accessed: 11. 10 2016, Available form: Intel Developer Zone:https://software.intel.com/en-us/articles/intel-xeon-phicoprocessor-codename-knights-corner11122
- Intel Corporation. (2015). Generating an Offload Report.Accessed: 11. 10 2016, Available form: Intel Developer Zone: https://software.intel.com/en-us/node/522521
- Oberhuber T., K. J. ( in preparation). TNL: Framework for the finite difference method on modern parallel architectures.
- OpenMP. (7 2013). OpenMP Application Program Interface.Accessed: 12. 12 2016, Available form: OpenMP:http://www.openmp.org/wp-content/uploads/OpenMP4.0.0.pdf
Uwagi
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-d6e8c203-a2ba-4a23-8627-854bbd8c9ebf