Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 13

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  algorytmy równoległe
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
Logistyka
|
2015
|
nr 3
3020--3029, CD 1
PL
Artykuł zawiera analizę możliwości zwiększenia konkurencyjności i wydajności przedsiębiorstwa zajmującego się wykonywaniem analiz i obliczeń związanych z symulacjami rozprzestrzeniania się zanieczyszczeń w atmosferze poprzez zastosowanie komputerów klastrowych, jako narzędzia minimalizującego czas obliczeń. Autor opisuje również zagadnienia związane z podstawami modelowania systemów monitorujących rozprzestrzenianie się zanieczyszczeń w powietrzu atmosferycznym. Opisane zostały również podstawowe podziały zanieczyszczeń, typy źródeł zanieczyszczeń i rodzaje emiterów. W dalszej części artykułu opisano podstawowe typy opisywanych modeli, jak również możliwe ich implementacje programistyczne, a także sposoby optymalizacji i usprawnienia ich działania poprzez zastosowanie klastrów komputerowych podczas wykonywania obliczeń.
EN
This article contains information about modeling of pollutants dispersion systems in the atmosphere. It also describes main types of pollutants, emission points and analysis of typical atmosphere pollutant dispersion models. It shows a way of using computer cluster systems in modeling process and a proper programming libraries for parallel computing. It also contains information about computational efficiency’s increase possibilities and computer cluster systems using profits for computational industries.
PL
Język skończony jest dekomponowalny, jeżeli może zostać zapisany jako złożenie dwóch niepustych języków. W niniejszym artykule zaproponowany został równoległy algorytm dekompozycji języków skończonych. Efektywność przedstawionego algorytmu została oceniona na podstawie eksperymentów przeprowadzonych dla wybranych języków.
EN
A finite language is said to be decomposable, if it can be written as a catenation of two non-empty languages. In this paper a parallel algorithm for finding the decomposition of finite languages is proposed. The effectiveness of the algorithm is assessed based on the experimental results provided for selected languages.
EN
A finite language is said to possess a non-trivial decomposition if it can be represented as a catenation of two non-empty languages. In this paper two parallel versions of a known sequential algorithm for finding the decomposition of finite languages are proposed. The effectiveness of the algorithms is estimated based on the experimental results obtained for several sample languages.
PL
Problem dekompozycji języków skończonych jest rozstrzygalny, chociaż trudny do rozwiązania. Problem sprowadza się do wyznaczenia pary niepustych języków skończonych L1, L2, takich że w wyniku operacji ich złożenia powstaje język wejściowy. Każdy język skończony posiada dekompozycję trywialną, a oprócz niej zero lub więcej dekompozycji nietrywialnych. Ze względu na brak algorytmu pozwalającego na wyznaczenie zbioru dekompozycji dla dowolnego języka, w artykule zaproponowano rozwiązanie oparte na przeszukiwaniu wyczerpującym z obcinaniem przestrzeni rozwiązań. Artykuł przedstawia dotychczasowe próby rozwiązywania problemu dekompozycji języków skończonych z wykorzystaniem algorytmów sekwencyjnych (rys. 1) oraz równoległych (rys. 2 i 3). Na podstawie znanych algorytmów opracowano ulepszone wersje algorytmu równoległego (rys. 4 i 5). W zaproponowanym rozwiązaniu skoncentrowano się na minimalizacji narzutu czasowego wynikającego z komunikacji pomiędzy procesami. Dokonana ocena efektywności opracowanych algorytmów oparta została o pomiary czasu wykonania dla implementacji z użyciem biblioteki MPI. Uzyskane wyniki (tab. 1), a w szczególności przyspieszenia pozwalają na ocenę rozwiązań jako nie w pełni zadowalających, w odniesieniu do wykorzystanej liczby procesorów.
4
Content available remote Acceleration of information-theoretic data analysis with graphics processing units
EN
Information-theoretic measures are frequently employed to assess the degree of feature interactions when mining attribute-value data sets. For large data sets, obtaining these measures quickly poses an unmanageable computational burden. In this work we examine the applicability of consumer graphics processing units supporting CUDA architecture to speed-up the computation of information-theoretic measures. Our implementation was tested on a variety of data sets, and compared with the performance of sequential algorithms running on the central processing unit.
PL
Miary informacji takie jak informacja wzajemna są często używane do określania stopnia współzależności cech podczas eksploracji zbiorów danych opisanych atrybutami. Dla dużych zbiorów danych, proste wyliczanie tych miar prowadzi wprost do znacznego wzrostu nakładów obliczeniowych. Praca jest poświęcona możliwościom zastosowania programowalnych kart graficznych do przyspieszenia wyznaczania miar informacji. Nasza implementacja została przetestowana na różnych zbiorach danych oraz porównana z implementacją sekwencyjną na procesorze głównym.
PL
W pracy został zaprezentowany wektoryzowany algorytm obliczania transformaty S w dwóch wariantach - w postaci sekwencyjno-równoległej pozwalającej na oszczędzenie zasobów sprzętowych oraz w postaci równoległej pozwalającej wykorzystać, nowoczesne wielordzeniowe platformy obliczeniowe. W drugim przypadku możliwa jest znaczna redukcja czasu trwania algorytmu. Obie metody mogą znaleźć zastosowanie praktyczne zależnie od oczekiwanej dokładności (rozdzielczości) i szybkości działania jak też możliwości platformy obliczeniowej.
EN
In the paper the algorithm for calculating N by N-point S Transform is presented. In a sequential, recursive option hardware resources saving is available, while on the other hand, a parallel version of the algorithm allows increasing the accuracy and reducing the time when using multi-core platforms. Two of these approaches can be implemented in practical use depending on the expected accuracy, speed and power of the hardware platform. At the beginning of the paper uses of S Transform with other similar solutions are described. Advantages and disadvantages of S Transform, which are good properties of the time-frequency analysis of non-stationary signals thanks to a movable, different sized Gaussian window, but at the same time a long computation time of the standard, sequential method, are considered. Next, the theoretical, continuous form of the transform and the discrete form with the sequential algorithm are presented. Later The main part of the work deals with synthesis of the sequential and parallel version of the algorithm in the matrix-vector form. The data flow in the algorithms in space and time is shown in Figs. 1 and 2 (for sequential and parallel approach). Finally, the computation times of two versions are compared. The advantage of the two presented approaches is simple and understandable tensor product representation which makes the implementation easy. The sequential algorithm can be used for slower platforms, where the real time analysis is not necessary, while the parallel version offers quick computation on multi-core processors.
PL
W artykule przedstawiono przykładowe rezultaty analizy efektywności równoległych realizacji algorytmu Gaussa-Seidela zaimplementowanych w środowisku procesorów wielordzeniowych. Jak pokazano, standardowa równoległa implementacja tego algorytmu, prowadzi do gorszych w sensie szybkości zbieżności wyników w porównaniu do sekwencyjnej wersji tej metody. Zaproponowana nowa wersja równoległa metody Gaussa-Seidela posiada analogiczną szybkość zbieżności jak jej realizacja sekwencyjna, zachowując przy ty łatwość implementacji równoległej. W artykule przedstawiono przykładowe rezultaty obliczeń przeprowadzonych przy wykorzystaniu procesora czterordzeniowego. Rozważana implementacja algorytmu Gaussa-Seidela posiada też możliwości jej zastosowania dla szerszej niż rozważana w pracy klasy problemów optymalizacji.
EN
The paper presents results of the efficiency analysis for some parallel realization of optimisation algorithms in multicore processors. The results concern a simple Gauss-Seidel optimization algorithm. In the paper both standard parallel and new parallel implementations of the Gauss-Seidel algorithm are presented. As it is pointed out, the standard parallel algorithm leads to worse numerical results (in terms of the rate of computation convergence) than the sequential version of this algorithm. The new parallel algorithm achieves the same numerical ef?ciency of computations as the sequential algorithm and, additionally, can be aesily implemented in multicore processors. It is prooved that, for the quadratic optimization problem, the modified parallel Gauss-Seidel algorithm leads to the same computational results as for the sequential implementation of the method. Some examples of parallel implementations of the method in fourcore processors are presented. The proposed new algorithm enables achieving good efficiency of parallel computations both in terms of the execution time and the speedup factor value. The new algorithm can also be used to solve broader classes of optimization problems, which in the nearest neighbourhood of the optimal solution can be sufficiently precisely approximated by the square function.
EN
In this paper, implementation of Quantum-Inspired Genetic Algorithm(QIGA) in massively parallel environment (Graphics Processing Units) has been presented. Contrary to many recent papers concerning parallel implementation of evolutionary algorithms, in this paper a novel approach has been taken. QIGA algorithm has been implemented entirely as a computational kernel. Parallelization of the algorithm has been performed on two levels: In a block of threads, each thread transforms a separate individual or different gene; In each block, separate populations with same or different parameters are evolved. Finally, the computations have been distributed to eight GPU devices, and over 400x speedup has been gained in comparison to sequential implementation of the algorithm in ANSI C on one Intel Core i7 2.93 GHz CPU core. Correctness of the results has been verified in statistical analysis. The presented approach can be applied to experimentation with a broad class of metaheuristics.
PL
W artykule zostały przedstawione szczegóły implementacji kwantowo inspirowanego algorytmu genetycznego (QIGA) w środowisku obliczeń masowo równoległych na procesorach kart graficznych. W odróżnieniu od wielu dotychczasowych opracowań, prezentujących implementacje algorytmów ewolucyjnych w środowiskach obliczeń równoległych, w niniejszym artykule zostało zaproponowane nowatorskie podejście do implementacji algorytmu ewolucyjnego. Zrównoleglenie algorytmu zostało wykonane na dwóch poziomach: poszczególne osobniki w populacji lub poszczególne geny są przetwarzane przez osobne wątki w blokach, a w poszczególnych blokach przeprowadzany jest proces ewolucji populacji o tych samych lub różnych parametrach. Obliczenia zostały rozdzielone na osiem jednostek GPU, co pozwoliło na uzyskanie ponad 400-krotnego przyśpieszenia algorytmu w stosunku do sekwencyjnej implementacji w języku ANSI C na pojedynczym rdzeniu procesora Intel Core i7 2,93 GHz. Poprawność implementacji została zweryfikowana poprzez analizę statystyczną otrzymanych wyników. Zaproponowane podejście pozwala przyśpieszyć badanie dowolnych metaheurystyk przeszukiwania.
EN
Purpose of this paper: In this paper we present a summary of the results reached in the field of computer tomography applied in some special case – for the problem of incomplete projection data. This particular problem arises in the technical issues in which, for some reasons (like for example size of the examined object, its localization or its accessibility), it is impossible to apply the standard algorithms of computer tomography. Design/methodology/approach: In the paper we discuss the standard algebraic algorithms of computer tomography and, additionally, the new algebraic algorithms (parallel and chaotic), designed by the authors, suitable not only for the case of incomplete projection data but also useful in the standard approach. Findings: The above mentioned algorithms are tested in solving the problems of reconstruction the discrete objects of high-contrast. Moreover, convergence, stability and utility of the algorithms are proved experimentally. Research limitations/implications: Algorithms, created by the authors, are designed for the multiprocessor computers which allow to execute the calculations simultaneously. However, the results compiled in the paper were elaborated by using the one-processor computer. Calculations in which the parallel computing structure will be used are planned for the nearest future.Practical implications: Possibilities of the effective applications of the discussed algorithms in different practical technical problems are showed in the paper. Research, done till now, indicate the chances of applying the proposed algorithms in certain technical problem in which the incomplete projection data appear (like, for example, in searching for the elements in material which cause decreasing of its strength or in looking for the compressed gas reservoirs in the coal bed, which can be dangerous for the people’s life and health). Originality/value: The paper presents the reconstruction algorithms (block and chaotic-bloc), designed by the authors, which appear to be more effective than the standard algebraic algorithms adapted for solving problems with the incomplete projection data.
PL
Celem niniejszej pracy jest wykorzystanie mechanizmów zdalnego wywołania procedur do integracji wielu platform komputerowych do rozwiązania złożonych algorytmów obliczeniowych. W tym celu wykorzystano heterogeniczną sieć komputerową, składającą się z komputerów o różnej architekturze i pracujących pod kontrolą różnych systemów operacyjnych.
EN
The aim of this work is to use remote procedure call mechanisms to integrate multiple computer platforms in order to solve complicated computation algorithms. A heterogeneous computer network consisting of computers with different architectures and different operating systems.
EN
We consider the parallel generation of matrices corresponding to models of congestion control mechanisms' behavior. We develop a piece of software for a cluster architecture and analyze its performance times, amount of communication, each processor's load. The resulting application is scalable and also produces a substantial speedup and efficiency.
PL
Rozważamy równoległą generację macierzy odpowiadających modelom zachowania mechanizmów kontroli zatłoczenia. Rozwijamy oprogramowanie dla architektury klastrowej i analizujemy czasy jego działania, ilość komunikacji, obciążenie każdego z procesorów. Otrzymana aplikacja jest skalowalna i daje znaczące przyśpieszenie oraz efektywność.
PL
W dobie rozwoju technologicznego stajemy przed coraz trudniejszymi zadaniami obliczeniowymi. Alternatywą dla pogoni za mocą obliczeniową komputera jest wykorzystanie możliwości jakie oferuje system klastrowy. W artykule omówiono możliwości dotarcia do komputera klastrowego na przykładzie Politechniki Opolskiej. Przybliżono sposób nawiązywania połączenia oraz niezbędne wymagania. Opisano również bibliotekę równoległego programowania MPI. Artykuł zawiera również analizę wydajności przykładowego algorytmu algebry liniowej w systemie klastrowym.
EN
In a high technology age we live, single PC computers are often not enough for comlitated computing problems. This article is about methods of using computer cluster systems with a proper programing libraries, for example MPI library. It also contains an example analysis of linear algebra algorithm which was tested on a cluster computer system placed at Technical University of Opole.
PL
W pracy przedstawiono trzy równoległe algorytmy symulowanego wyżarzania dla problemu trasowania pojazdów z ograniczeniami czasowymi. Zbadane zostały sposoby współpracy procesów w algorytmach równoległych w celu uzyskania rozwiązań o jak najwyższej jakości. Przedstawiono wyniki badań eksperymentalnych dla wybranych danych testowych Solomona.
EN
The paper describes three parallel simulated annealing algorithms to solve the vehicle routing problem with time windows. The ways of co-operation between processes to achieve a better accuracy of solution to the problem is investigated. The experimental results carried out on the test set by Solomon arę presented.
PL
W artykule przedstawiono równoległe algorytmy obliczania splotu liniowego dyskretnych sekwencji danych. Przy syntezie tych algorytmów wykorzystane zostały idee segmentacji procesów przetwarzania danych, zdefiniowane poprzez metody "Overlap-Save" oraz "Overlap-Add". Szczegółowo przedstawio-no struktury i zasady budowy konstrukcji macierzowych wchodzących w skład procedur obliczeniowych, opisujących te algorytmy.
EN
This article presents the parallel algorithms for calculation of the linear convolution of diserete data. Ideas of segmentation of the data processing like as "Overlap-Save" and "Overlap. Add" methods are used in synthesis of algorithms. The paper also represents structures and organization principles of matrix construction, which are included in computational procedures those algorithms.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.