Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
A memory and blocks of threads management in parallel computation using CUDA architecture
Języki publikacji
Abstrakty
Dzięki upowszechnieniu się procesorów wielordzeniowych przetwarzanie danych za pomocą obliczeń równoległych staje się coraz bardziej dostępne dla szerokiego grona użytkowników. Przykładem jest opracowana przez firmę NVIDIA architektura CUDA, będąca architekturą wielordzeniowych procesorów graficznych. Procesor graficzny może być traktowany jako procesor SIMD z pamięcią wspólną. Na przykładzie operacji mnożenia macierzy zbadano wpływ zarządzania pamięcią i blokami wątków na czas obliczeń z użyciem architektury CUDA.
With the propagation of a multi-core processors a parallel data processing becomes more accessible to a wide range of users. An example is CUDA architecture developed by NVIDIA, which is a multi-core GPU architecture. The GPU can be treated as a SIMD processor with shared memory. The influence of memory management and blocks of threads management on time of computation using CUDA architecture was researched on the basis of matrix multiplication.
Czasopismo
Rocznik
Tom
Strony
75--96
Opis fizyczny
Bibliogr. 13 poz.
Twórcy
autor
- Politechnika Śląska, Instytut Informatyki, Gliwice, Akademicka 16, jacek.widuch@polsl.pl
Bibliografia
- 1. Cormen T. H., Leiserson C. E., Rivest R. L.: Wprowadzenie do algorytmów. WNT, Warszawa 2000.
- 2. Kirk D. B., Hwu W. W.: Programming Massively Parallel Processors: A Hands-on Approach. Morgan Kaufmann, 1st edition (February 5,2010).
- 3. Mattson T. G., Sanders B. A., Massingill B. L.: Patterns for Parallel Programming. Addison-Wesley Professional, 1st edition (September 25,2004).
- 4. Pacheco P.: Parallel Programming with MPI. Morgan Laufmann, 1st edition (October 15, 1996).
- 5. Parberry I.: Parallel Complexity Theory. John Wiley & Sons Inc (September 1987).
- 6. Parhami B.: Introduction to Parallel Processing: Algorithms and Architectures. Springer,1 st Edition (January 31,1999).
- 7. Rauber T., Runger G.: Parallel Programming for Multicore and Cluster Systems. Springer, 1st edition (March 10,2010).
- 8. Sanders J., Kandrot E.: CUDA by Example: An Introduction to General-Purpose GPU Programming. Addison-Wesley Professional, 1st edition (July 30,2010).
- 9. Wittwer T.: An Introduction to Parallel Programming. VSSD, 1 st edition, 2006.
- 10. NVIDIA CUDA Best Practices Guide Version 3.0. NVIDIA Corporation (February 4, 2010), http://www.nvidia.pl/object/cuda_getjpl.html.
- 11. NVIDIA CUDA Programming Guide Version 3.0. NVIDIA Corporation (February 20, 2010), http://www.nvidia.pl/object/cuda_getjpI.html.
- 12. NVIDIA CUDA Reference Manual Version 3.0. NVIDIA Corporation (February, 2010), http://www.nvidia.pl/object/cuda_get_pl.html.
- 13. Timeout Detection and Recovery of GPUs through WDDM. Windows Haulwjn Developer Central, Microsoft Corporation, (Updated: April 27, 2009), http:.microsoft.com/whdc/device/display/wddm_timeout.mspx.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSL7-0050-0019