PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Badania lokalności aplikacji równoległych bazujących na tworzeniu niezależnych wątków obliczeń

Identyfikatory
Warianty tytułu
EN
Experimental studies on data locality of parallel applications consisting of synchronization-tree threads of computations
Języki publikacji
PL
Abstrakty
PL
Efektywne wykorzystanie hierarchii pamięci wymaga od programów równolegle przetwarzających wydzielone sekwencje operacji dobrej lokalności danych. W artykule przedstawiono analizę i badania eksperymentalne lokalności danych L1D Cache dla trzech wybranych przypadków programów, w których przy użyciu metody wyznaczania niezależnych wątków obliczeń [1] zostały wydzielone niezależne wątki obliczeń, przetwarzane w pętlach programowych. Rozważane przypadki zostały zaimplementowane w języku C++, przydzielone do równoległych wątków za pomocą dyrektyw OpenMP i wykonane na docelowej architekturze Intel SMP. Zaprezentowano zastosowanie programowego analizatora wydajności Intel® Vtune™ Performance Analyzer do zgromadzenia metryk i oceny lokalności danych progra­mów równoległych. Na podstawie uzyskanych wyników wyprowadzono zalecenia dla programistów, aby tworzone przez nich oprogramowanie cechowała dobra lokalność danych.
EN
The effective use of hierarchical memory for parallel programs performing computations in slices requires good data locality. Analysis and experimental studies on data locality in L1D Cache for three selected cases of parallel programs representing synchronization-free threads of computations extracted by means on the method described in [1], are presented in the paper. The considered cases we re implemented in C++, assigned to parallel threads by means of OpenMP directives and executed on a target Intel SMP architecture. The usage of the software analysis tool Intel®  VTune™ Performance Analyzer to collecting and evaluating data locality metrics is presented. Finally, recommendations for software developers are concluded to develop numerical applications with good data locality metrics.
Rocznik
Strony
74--81
Opis fizyczny
Bibliogr. 12 poz., tab., wykr.
Twórcy
autor
autor
  • Zachodniopomorski Uniwersytet Technologiczny, Wydział Informatyki
Bibliografia
  • [1] Bielecki W., Siedlecki K.: Extracting synchronization-free slices in perfectly nested loops. Electonic Modeling, vo1. 29, no 6, Kijów 2007, pp. 61-76.
  • [2] Threading Methodology: Principles and Practices. Version 2.0, Intel Corporation, 2004.
  • [3] Aho A. V., Lam M. S., Sethi R., Ullman J. D.: Compilers: Principies, Techniques and Tools, 2nd Edition. Addison-Wesley, 2006.
  • [4] http://www.intel.com/supportloerformancetools/vtune/
  • [5] Intel® 64 and IA-32 Architectures Software Developer's Manual, Intel Corporation, 2008.
  • [6] Intel® Core™2 Duo Processor E8000 and E7000 Series, Intel Corporation, 2008.
  • [7] Intel Procesor Identyfication Utility, Version 4.00.20081113, Intel Corporation, 2008.
  • [8] CPU-Z, Version 1.48, CPUID Software Development Kit, 2008.
  • [9] Wilson G. V.: Practical Parallel Programming. The MIT Press, 1995.
  • [10] http://en.wikipedia.org/
  • [11] Beyls K.: Software Methods to Improve Data Locality and Cache Behavior, PhD dissertation, Universiteit Gent, 2004.
  • [12] Intel® VTune™Performance Analyzer. VTune™ Performance Environment Help, Intel Corporation, 2008.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAN-0005-0014
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.