Warianty tytułu
Introduction to the optimal use of MapReduce
Języki publikacji
Abstrakty
Artykuł ma na celu przedstawienie krytycznych punktów w MapReduce prowadzących do utraty lub zysku w wydajności. Jest to wstęp do dokładniejszej analizy poszczególnych faz wykonania występujących w większości implementacji z wykorzystaniem tegoż paradygmatu. Poruszane są ogólne zagadnienia związane z danymi, mapowaniem, redukcją, partycjonowaniem oraz kilka innych.
Purpose of the paper is to create simple overview of critical points for performance in MapReduce. This is introduction to more detailed analysis of execution phases being part of the most issues implemented using said paradigm. Discussed are general issues related to data, mapping, reduction, partitioning and several others.
Czasopismo
Rocznik
Tom
Strony
3870--3875
Opis fizyczny
Bibliogr. 5 poz., rys., pełen tekst na CD
Twórcy
autor
- Politechnika Białostocka, ebuslowska@pb.edu.pl
autor
- Politechnika Białostocka, lukjuz@gmail.com
Bibliografia
- 1.J. Dean, S. Ghemawat: MapReduce: Simplified Data Processing on Large Clusters, OSDI’04: Sixth Symposium on Operating System Design and Implementation, San Francisco, CA, 2004, http://research.google.com/archive/ mapreduce.html.
- 2.Ch. Lam: Hadoop in Action, Manning, 2010.
- 3.A. Holmes: Hadoop in Practice, Manning, 2012.
- 4.G. Kamat, S. Singh: Compression Options in Hadoop – A Tale of Tradeoffs, Hadoop Summit, 2013, http://www. slideshare.net/Hadoop_Summit/kamat-singh-june27425pmroom210cv2.
- 5.M. Bhandarkar: Practical Problem Solving with Hadoop and Pig, Middleware, 2009, http://www.slideshare.net/ hadoop/practical-problem-solving-with-apache-hadoop-pig.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-48cffe6f-8158-45bf-a202-d6535eed17f2