In this work the software library for binaural sound localization is presented. The main purpose of the library are the applications for localization tasks in audio systems based on two microphones. The implemented mechanisms include binaural single sound source localization, ITD (Interaural Time Difference) and ILD (Interaural Level Difference) cues and support real-time analysis. LibLaura is written in C++ language and is easily extensible to support new features, time delay estimators and user-defined callbacks.
A modification of the most efficient version of MPEG4 Lossless Audio with extension of the RLS (Recursive Least Square) and NLMS (Normalized Least-Mean-Square) blocks is described in the paper. Moreover, a segmentation block influencing the selection of proper predictive modelling parameters is introduced. These blocks have been implemented in hardware description language ImpulseC and synthesised into a reprogrammable device from the Xilinx Virtex5 family.
PL
W pracy zaprezentowano rozwinięcie najwydajniejszej wersji MPEG4 Lossless Audio przez rozbudowanie bloków RLS (Recursive Least Square) i NLMS (Normalized Least-Mean-Square), wprowadzając przy tym blok segmentacji wpływający na dobór odpowiednich parametrów modelowania predykcyjnego. Zwiększono nie tylko rząd predykcji w poszczególnych blokach modelowania, ale też rozwinięto metodę NLMS do ES-NLMS i dobrano eksperymentalne wartości współczynników uczących, a także odpowiednie proporcje liczby współczynników predykcji w trybie stereo. Ponadto opracowano własny blok adaptacyjnego kodera arytmetycznego, w którym wykorzystano adaptacyjne kodowanie Golomba-Rice'a. Każdy z tych bloków został przygotowany do potrzeb implementacji sprzętowej. Bloki RLS i NLMS wykorzystują dane pochodzące z modułu segmentacji, co ma pozytywny wpływ na efektywność kompresji. Głównym zadaniem bloku segmentacji jest wydzielenie segmentów różniących się zawartością akustyczną. Wykorzystano na tym etapie dwa podejścia do segmentacji – pierwsze z nich realizuje podejście polegające na porównywaniu sąsiednich ramek sygnału w przestrzeni cech składającej się z 12 współczynników MFCC (Mel-Frequency Cepstral Coefficients) i drugie polegające na ocenie dwóch modeli w przestrzeni cech w użyciem typowego podejścia opartego o Bayesowskie kryterium informacyjne. Wyniki uzyskane z obu technik są następnie łączone w celu kompensacji potencjalnych błędów określających granice segmentów. Dla każdego z uzyskanych segmentów wyznaczany jest uśredniony wektor cech MFCC, który dostarczany jest do bloków RLS i NLMS jako źródło do określania kontekstu. Bloki funkcjonalne zostały zaimplementowane w języku opisu sprzętu ImpulseC oraz dokonano syntezy do układu reprogramowalnego z rodziny Xilinx Virtex5.
In this paper, experimental results of a proposed hardware acceleration of feature extraction and data classifiers for multimedia are presented. This hardware is based on multi-core architecture connected with a mesh Network on Chip (NoC). The cores in the system execute both data classifiers and feature extraction for audio and image data. Using various meta heuristics the system is optimized with regards to different data communication criteria. The system was implemented on an FPGA platform with use of ImpulseC hardware description language.
PL
W artykule zostały zeprezentowane wyniki eksperymentalne dotyczące sprzętowego przyspieszania ekstrakcji cech i klasyfikacji danych multimedialnych. Opracowane rozwiązanie sprzętowe bazuje na architekturze wielordzeniowej, w której każdy blok realizuje przypisaną mu statycznie funkcjonalność. Rdzenie połączone są ze sobą za pomocą sieci wewnątrzukładowej (ang. Network on Chip, NoC) o architekturze siatki. W artykule opisano pokrótce autorskie oprogramowanie służące do generowania kodu sieci wewnątrzukładowej. Graficzny interfejs użytkownika został zaprezentowany na rys. 1. Narzędzie ma za zadanie dokonywać odwzorowania wybranych funkcjonalności do poszczególnych rdzeni z wykorzystaniem takich meta-heurystyk jak algorytmy genetyczne, symulowane wyżarzanie, poszukiwanie losowe czy algorytmu gradientowego. Jako kryterium optymalizacji można wybrać minimalizację całkowitego przesyłu danych, minimalizację maksymalnej liczby danych transmitowanych przez pojedyncze łącze, a także minimalizację odchylenia standardowego rozmiaru strumieni transmitowanych przez poszczególne łącza. Przykładowe wyniki optymalizacji losowej dla sieci wewnątrzukładowej zostały przedstawione w tab. 1, natomiast wyniki optymalizacji dla sieci wewnątrzukładowej wykorzystującej inne podejścia - w tab. 2. Dla systemu zoptymalizowanego w ten sposób został wygnerowany opisujący go kod w języku ImpulseC, który następnie posłużył do syntezy sprzętowej na układzie FPGA z rodziny Xilinx Virtex 5. Zajętość układu XC5VSX50T dla trzech wykorzystanych klasyfikatorów została przedstawiona na rys. 3. Z kolei tab. 3 przedstawia liczbę zasobów wykorzystanych przez narzędzie syntezy wysokiego poziomu dla tych klasyfikatorów. Technika przedstawiona w publikacji umożliwia określenie warunków i ograniczeń implementacji sprzętowej systemu służącego klasyfikacji danych multimedialnych.
In this paper an analysis of the CDMA-based transmission in Network on Chip (NoC) is presented. In order to realize CDMA transmission scheme between IP cores in the NoC, dedicated encoders and decoders using Walsh codes are proposed. To check the possibility of implementing CDMA NoC, a parametrization stage of audio analysis system was adapted to the NoC structure as a set of 14 independent blocks. The system was implemented with use of the ImpulseC hardware description language on an FPGA platform (Xilinx Virtex-5). The obtained results and the requirements needed to realize the CDMA scheme in the hardware show that a higher number of transmitted bits does not lead to any benefits over bus-based transmission.
PL
W pracy została przedstawiona analiza wykorzystania transmisja strumieni danych między blokami IP w strukturze sieci wewnątrzukładowej (NoC) z użyciem rozpraszania kodowego CDMA. Ponieważ typowe rozwiązania łączenia bloków w systemach MPSoCs oparte o sieci wewnątrzukładowe wykorzystują routing typu wormhole, często pojawia się problem związany z dostępem do wspólnych zasobów. W artykule podjęto próbę zmiany mechanizmu transmisyjnego w celu określenia możliwości poprawy takiej sytuacji. Proponowane podejście wykorzystuje transmisję CDMA z zastosowaniem kodów Walsha. W celu relizacji zadań transmisyjnych opracowane zostały dedykowane układy kodera i dekodera CDMA wykorzystywane do komunikacji między blokami przetwarzającymi. Do oceny i weryfikacji proponowanego rozwiązania zdecydowano się na użycie modułu parametryzacji sygnałów akustycznych (rys. 2), pracującego na strumieniach danych. Blok ten przetwarza strumień akustyczny dzieląc go na równej długości ramki i dla każdej z nich wyznacza ponad 100 deskryptorów. Zaproponowane rozwiązanie zostało zaimplementowane w układzie FPGA z rodziny Virtex 5 wykorzystując język opisu sprzętu ImpulseC. W wyniku przeprowadzonej analizy wydajności transmisyjnej i narzutu spowodowanego specyfiką rozpraszania kodowego uzyskano wyniki gorsze niż w przypadku tradycyjnej transmisji wykorzystującej magistrale. Ponadto, konieczność stosowania globalnej synchronizacji oraz w wielu sytuacjach również globalnego routingu powoduje, że transmisja CDMA w sieciach NoC nie stanowi konkurencji do rozwiązań magistralowych dedykowanych przetwarzaniu danych strumieniowych.
In this paper there is described a possibility of context switching into a lossless compression system. The context is determined based on the features of the previous signal samples. Each context is associated with an individual predictor. The idea of context switching allows us to choose one of the set of a few predictor models individually for each sample instead of each frame. Consequently, the system adjusts fast in case of rapid signal changes. The system was implemented using the ImpulseC hardware description language and implemented on an FPGA platform.
PL
W nowoczesnych metodach kompresji audio wykorzystuje się zwykle dwa etapy: dekompozycję danych, a następnie kompresję jedną z wydajnych metod entropijnych. Najczęściej do modelowania służy typowy predyktor liniowy rzędu r, który jest wartością przewidywaną aktualnie kodowanej próbki na podstawie r poprzednich próbek sygnału. Kluczową rolę odgrywa tu sposób doboru współczynników danego modelu. Mogą być one ustalone na stałe, statyczne w obrębie jednej kodowanej ramki, jak i w pełni adaptacyjne. Główną propozycją wzrostu efektywności kompresji zaprezentowaną w tej pracy jest wprowadzenie przełączania kontekstów, które wyznacza się na podstawie cech sygnału poprzednich próbek. Każdemu kontekstowi przypisany jest indywidualny predyktor. W artykule przedstawiono podział na 2 oraz 3 konteksty (tab. 1). Przedstawiono metodę statyczną uwzględniającą zależności międzykanałowe, a także kodowanie międzykanałowe z przełączaniem kontekstów. Aby sprawdzić możliwości uogólnienia i uproszczenia pomiarów, wybrano zestaw utworów muzycznych. Proponowana metoda w 60% przypadków skutkowała zmniejszeniem średniej bitowej. Dysponując pełnym zestawem wyników użycia 140 deskryptorów dla wybranych utworów, można spróbować wybrać kilka deskryptorów dających najlepsze rezultaty, a następnie zastosować je do innych utworów testowych. Zaproponowany algorytm został zaimplementowany w układzie FPGA z rodziny Virtex 5 wykorzystując język opisu sprzętu ImpulseC (tab. 3).
In this paper, a technique for determining required link band-width of a multi-path routing algorithm dedicated to Network on Chip (NoC) is presented. The proposed algorithm is based on the linear programming and allows us to avoid deadlocks and contentions in case of Tapeworm routing used for data-dominated streaming multimedia applications realized in Multi Processor Systems on Chip. The proposed approach is illustrated with an example of features extraction module for the Automatic Speech Recognition (ASR) system.
PL
W artykule opisano technikę określania wymaganej przepustowości łączy sieci wewnątrzukładowej z routingiem wielościeżkowym. Zaproponowany algorytm bazuje na programowaniu liniowym i umożliwia unikanie blokad w routingu typu Tapeworm, wykorzystywanego dla multimedialnych aplikacji zdominowanych przez dane realizowanych w układach typu MPSoC. Autorski algorytm routingu Tapeworm dla niektórych aplikacji multimedialnych okazuje się być wydajniejszy od XY, powszechnie używanego algorytmu routingu w NoC. Zaproponowane podejście zostało zilustrowane przykładem modułu ekstrakcji cech w systemie automatycznego rozpoznawania mowy. Klasyczny diagram takiego modułu został przedstawiony na rys. 1. W celu określenia marszrut pomiędzy rdzeniami realizującymi funkcjonalności poszczególnych bloków tego modułu została zaadaptowana technika znana z tradycyjnych sieci komputerowych, opisana m.in. w [8]. W artykule zaproponowano sposób wyboru ścieżek między rdzeniem źródłowym i docelowym, opisano sposób określania ograniczeń, a także zaproponowano funkcję celu uwzględniającą długość ścieżki. Do wyszukiwania optymalnej przepustowości łączy wykorzystano algorytm przypominający wyszukiwanie binarne. Badania eksperymentalne, w ramach których zaimplementowano opisany moduł w języku SystemC, a także wykorzystano komercyjne narzędzie do rozwiązywania problemu programowania liniowego, potwierdzają skuteczność i efektywność opisywanego podejścia.
In this paper, we propose a mapping scheme of IP cores into irregular Network on Chips using an example module dedicated to features extraction for automatic speech recognition system. We estimated the core sizes for various frame sizes and overlappings, and then tried to place cores communicating heavily close to each other, we test a number of widths in the 2D Rectangular Strip Packing problem. The obtained result range allows us to pick a solution that is beneficial both in terms of area and transfers between the system cores.
PL
W artykule zaproponowano sposób mapowania rdzeni IP w nieregularną sieć wewnątrzukładową. Jako przykładowego układu użyto moduł przeznaczony do ekstrakji cech systemu automatycznego rozpoznawania mowy. Dokonano estymacji rozmiaru rdzeni dla różnych rozmiarów ramki i zakładkowania, a następnie dokonano próby odwzorowania rdzeni do układu w ten sposób, by rdzenie wysyłające między sobą duże porcje danych zostały umieszczone blisko siebie.
In this paper a multi-path routing algorithm dedicated to Network on Chip (NoC) together with its implementation is presented. The proposed algorithm is based on the Ford-Fulkerson method and is aimed at data-dominated multimedia applications realized in Multi Processor Systems on Chip. The efficiency of the proposed technique is compared with the state-of-the-art NoC routing. Our implementation utilizing virtual channels allows us to obtain promising results in some popular multimedia codecs.
PL
W artykule został przedstawiony wielościeżkowy routing przeznaczony do sieci wewnątrzukładowych (ang. Network on Chip, NoC) wraz z jego implementacją. Proponowany algorytm został oparty na metodzie Forda-Fulkersona i jest przeznaczony do multimedialnych aplikacji strumieniowych zdominowanych przez dane, realizowanych w wieloprocesorowych systemach jednoukładowych (ang. Multi Processor Systems on Chip, MPSoC). Efektywność prezentowanej techniki została porównana z najpopularniejszym algorytmem routingu używanym w NoC - XY. Badania eksperymentalne wykazały, że w niektórych przypadkach uzyskano znaczącą poprawę czasu transmisji. Przedstawiona implementacja algorytmu wykorzystuje kanały wirtualne i, chociaż wymaga wykonania dodatkowych obliczeń, umożliwiła otrzymanie obiecujących wyników dla niektórych popularnych kodeków Multimedialnych, natomiast dla innych uzyskano nieco gorsze wyniki. Stąd trudno jednoznacznie wnioskować o wyższości wielościeżkowych mechanizmów routingu nad tradycyjnymi jednościeżkowymi. Routing typu tapeworm należy zatem postrzegać jako alternatywną propozycję routingu przeznaczoną dla strumieniowych algorytmów realizowanych w NoC, która poszerza przestrzeń poszukiwań korzystnej realizacji układowej. W niektórych przypadkach jej stosowanie znacznie polepsza wyniki, czasami zaś lepiej zastosować tradycyjne podejście. W chwili obecnej autorzy nie są w stanie zidentyfikować cech wspólnych algorytmów, które są korzystnie realizowalne z wykorzystaniem proponowanej techniki.
In recent years, speech recognition functionality is increasingly being added in embedded devices. Because of limited resources in these devices, there is a need to assess whether the defined speech recognition system is feasible within given constraints, as well as estimating how many resources the system needs. In this paper, an attempt has been taken to define a technique for estimating hardware resources usage in the speech recognition task. To determine the parameters and their dependencies in this task, the two systems were tested. The first system utilized Dynamic Time Warping pattern matching technique, the second used Hidden Markov Models. For each case, the measurement of recognition rate and time, vocabulary database size and learning time has been performed. Obtained results have been exploited to define linear and polynomial regression models, and finally, an estimation algorithm has been developed using these models. After testing proposed approach, it was observed that even low-end mobile phones have sufficient hardware resources for realisation of isolated speech recognition system.
In this paper, an efficiency of the Tapeworm routing, begin a multi-path routing algorithm dedicated to Network on Chip (NoC), are presented. The proposed algorithm is based on the Ford-Fulkerson method and is aimed at data-dominated streaming multimedia applications realized in Multi Processor Systems on Chip. The efficiency of the proposed technique is compared with the state-of-the-art NoC routing approach and in some cases we obtain a significant improvement. Our implementation utilizing virtual channels, despite imposing some overhead, allows us to obtain promising results in some popular multimedia codecs.
PL
W artykule przeanalizowano efektywność algorytmu routingu wielościeżkowego o nazwie Tapeworm, przeznaczonego dla sieci wewnątrzukładowych (ang. Network on Chip, NoC). Zaproponowany algorytm bazuje na klasycznej metodzie Forda-Fulkersona i jest przeznaczony do zdominowanych przez dane multimedialnych aplikacji strumieniowych realizowanych przez wieloprocesorowe systemy jednoukładowe. Efektywność proponowanej techniki jest porównana z najpopularniejszym algorytmem routingu w NoC. Przedstawiona implementacja wykorzystuje kanały wirtualne, które pomimo narzutów czasowych, umożliwiają uzyskanie zmniejszonych transferów między rdzeniami w przypadku kilku popularnych kodeków multimedialnych.
The paper presents an approach to classification of audio data using properties derived from low-level features. The new descriptors based on peakiness of the feature trajectory, and the crossing points between two selected trajectories. Calculated features are exploited in wrapper-based selection process and Support Vector Machines are employed to the speech/music classification problem. The obtained results show that proposed approach can be applied to perform audio classification in efficient manner.
PL
Podejście do klasyfikacji akustycznej przedstawione w pracy wykorzystuje charakterystykę zmienności cech niskopoziomowych. Wykorzystano własności występowania szczytów w trajektoriach cech oraz własności punktów przecięć pomiędzy dwoma wybranymi trajektoriami cech. Uzyskane w ten sposób deskryptory poddano selekcji z użyciem algorytmu wykorzystującego maszyny wektorów nośnych SVM dla problemu klasyfikacji sygnałów mowy i muzyki. Pokazano, że proponowane podejście i użyte cechy pozwalają uzyskać wysoką skuteczność klasyfikacji.
We analyzed a binary-tree based Network on Chip (NoC) architecture application for data transfer in real-time regime. In typical multimedia algorithms their links are not balanced using typical architectures, so we propose a simple algorithm for IP core mapping that significantly improves the link usage balance. The described experimental results show that the proposed architecture is characterized with lower target chip area and the yielded transfers are comparable with mesh architecture.
PL
W artykule została przeanalizowana możliwość zastosowania sieci wewnątrzukładowych (ang. Network on Chip, NoC) o architekturze drzewa binarnego do transmisji danych w czasie rzeczywistym dla algorytmów zdominowanych przez dane. Ponieważ w typowych algorytmach multimedialnych połączenia tradycyjnych NoC nie są wykorzystywane w sposób równomierny, wybór odpowiedniej architektury jest krytyczny dla efektywności transmisji danych i w rezultacie dla czasu realizacji obliczeń. W artykule zaproponowano prosty algorytm mapowania bloków IP, który w znacznym stopniu poprawia równomierność wykorzystania połączeń między rdzeniami. Zaprezentowane wyniki badań eksperymentalnych pokazują, że dla zaproponowanej architektury rozmiar docelowego układu będzie mniejszy, a transfery porównywalne z najpopularniejszą obecnie architekturą typu siatki. Uzyskane rezultaty mogą posłużyć do budowy adaptacyjnego algorytmu mapowania algorytmów do struktur sprzętowych z uwzględnieniem szeregu specyficznych ograniczeń algorytmów operujących na danych przesyłanych w czasie rzeczywistym.
A technique for classifying audio segments based on properties of feature contours is described. The proposed approach uses a simple method utilizing peaks detection procedure with adaptive thresholding and fusion of contours attributes. It is possible to determine the signal class based on statistical analysis of the distances set between peaks for selected feature contours. In order to validate presented method, results analysis of feature contours along with decision function was applied to the discrimination problem between speech and music signals. In the result, obtained classification accuracy was 98% for the considered test set.
PL
W pracy przedstawiono technikę pozwalającą na określanie klasy sygnału dźwiękowego poprzez wykorzystanie właściwości konturów cech. W zaproponowanym podejściu zastosowano wykrywanie pików w konturach przy użyciu zmiennego progu decyzyjnego oraz fuzji atrybutów konturów. Na podstawie analizy statystycznej uzyskanego zbioru odległości między pikami dla określonych konturów cech, możliwe jest określenie klasy sygnału. W celu weryfikacji prezentowanego podejścia przedstawiono zastosowanie wyników analizy konturów cech oraz funkcji decyzyjnej pozwalające w efektywny sposób (z dokładnością 98% dla użytego zbioru testowego) dokonywać klasyfikacji segmentów dźwiękowych zawierających mowę oraz muzykę.
The paper presents an analysis of the audio features for speech processing systems, where speech signal is contaminated by background noise. To determine robustness of speech features for different audio environments, a comparison between feature contours in clean and noisy conditions using mean-square error criterion was performed. The obtained results have been exploited to simple, low-complexity speech detection algorithm. Experimental results show that accurate determination of speech regions is highly dependent on recording conditions and speaker characteristics. However, such approach is suitable for automatic detection of sentence boundaries for speech processing systems.
PL
W pracy przedstawiono analizę cech wykorzystywanych w systemach przetwarzania sygnału mowy w kontekście jego detekcji w niekorzystnych warunkach rejestracji. W wyniku przeprowadzonej analizy określono zbiór cech, których kontury ulegają najmniejszym zniekształceniom na podstawie pomiaru błędu średniokwadratowego dla sygnału bez zakłóceń i zdegradowanego. Z użyciem tych cech zaproponowano prosty algorytm detekcji sygnału mowy o niskiej złożoności. Wyniki przeprowadzonych badań pokazują, że określenie dokładnych granic poszczególnych słów jest ściśle uzależnione od warunków akwizycji oraz rodzaju mówcy. Pomimo tego, proponowane podeście umożliwia określenie w sposób automatyczny granic wypowiedzi w systemach przetwarzania sygnału mowy.
In this paper, we demonstrate a technique for mapping a multimedia streaming application into a mesh NoC using an example of speech encoder named SPEEX. To decrease the size of the target mesh, we use an algorithm for merging functional blocks using various metrics, such as core code size or execution time. We propose and test three algorithms for core mapping. According to the presented experimental results, the process of assigning the functional block into the NoC mesh is strongly influenced by the selected strategy.
PL
W artykule zaprezentowano technikę odwzorowywania bloków realizujących algorytmy strumieniowe na strukturę mesh sieci NoC z wykorzystaniem przykładu - kodera mowy SPEEX. Aby zmniejszyć rozmiar docelowej sieci NoC, wykorzystano algorytm łączenie funkcjonalnych bloków wykorzystujących wybrane miary, takie jak rozmiar kodu lub czas wykonania. Dla optymalizacji sieci pod względem obciążeń czasowych oraz liczby instrukcji zawartych w poszczególnych blokach IP rozpatrywana jest sieci NoC o rozmiarach 6x6. Rozmiar omawianej struktury wynika z zestawienia kodera Speex o 4 różnych przepływnościach. Zaproponowano i przetestowano trzy algorytmy odwzorowujące rdzenie. Zaprezentowane algorytmy generują lokalnie najlepsze rozwiązania, dzięki wprowadzeniu funkcji heurystyki. Z punktu widzenia czasu realizacji zadań przez niezależne rdzenie, najmniejszy całkowity transfer uzyskano przy użyciu algorytmu drugiego. Z wykorzystaniem dodatkowego algorytmu balansującego uzyskano zmniejszenie standardowego odchylenia transferów na poziomie 20%. Otrzymane podczas badań wyniki dowodzą, że proces ustalenia odwzorowania bloków IP podczas projektowania sieci NoC jest niezwykle istotny. Efektywność i wydajność otrzymanego układu SoC może w dużej mierze zależeć od obranej strategii przydziału elementów funkcyjnych algorytmu DSP.
A new scheduling QoS algorithm dedicated for Network on Chips is proposed. It offers the possibility of adapting the scheduling packages dynamically which influences the order of transmission. This possibility allows us to change the obtained delays of various traffic classes. The provided experimental results confirm the assets of the proposed method in comparison with other techniques implemented in the same platform in the considered range of applications.
PL
W pracy zaproponowano nowy algorytm kolejkowania uwzględniający jakość usług w sieciach wewnątrzukładowych. Umożliwia on dynamiczne harmonogramowanie pakietów wpływające na kolejność transmisji pakietów. Dzięki temu istnieje możliwość zmiany uzyskanego opóźnienia dla różnych klas ruchu. Zaprezentowane wyniki badań eksperymentalnych potwierdzają zalety proponowanej metody w porównaniu z innymi technikami realizowanymi na tej samej platformie w rozważanym zakresie zastosowań.
17
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
This paper addresses the problem of automatic audio content identification. In order to determine regions of speech, music and silence in audio stream, the fusion of feature contours and their envelopes has been used. Additionally, a voicing detector and four class music genre identification stage have been incorporated into classification system. To minimize boundary errors of different audio regions, a smoothed envelope of feature contours has been proposed. Experimental results show that using proposed scheme, makes it possible to achieve acceptable classification rates for audio data segmentation. In result, this approach can be applied to the content type dependent multimedia processing.
A heuristic core mapping dedicated to multi-path routing algorithm for mesh Network on Chip dedicated to popular stream-based audio decoder algorithms is proposed. The processing units performing stages of a number of decoders are mapped into 2D mesh nodes in order to balance and minimize the bandwidths of the structure links. The experimental results confirming the benefits of the proposed approach are provided.
PL
W artykule przedstawiono heurystyczny algorytm odwzorowywania aplikacji zdominowanych przez dane do struktury dwuwymiarowej sieci wewnątrzukładowej. Jednostki przetwarzające są odwzorowywane do sieci NoC w sposób zmniejszający i wyrównujący przepustowości magistral wewnątrzukładowych. Do wyznaczania tras użyto wielościeżkowego algorytmu routingu.
Despite numerous research in Network on Chip domain, the subjects of shape selection and core mapping algorithms have been not widely analysed. Thus, in this paper the influence of these factors for the bandwidth and efficiency of the synthesized chip realizing streaming video applications is presented. The obtained results show the shape selection process is an important factor in multi-core mapping scheme for streaming algorithms. Such strategy can increase overall efficiency leading to balanced flows in target device.
PL
Pomimo licznych badań prowadzonych w tematyce sieci wewnątrzukładowych (ang. NoC - Network on Chip), zagadnienia doboru kształtu i algorytmy odwzorowania rdzeni nie były dotychczas poddane szerszej analizie. W artykule został przebadany wpływ tych czynników na przepustowość i efektywność zsyntetyzowanych układów realizujących strumieniowe algorytmy wideo. Otrzymane wyniki pokazują, że dobór odpowiedniego kształtu sieci do aplikacji jest istotnym czynnikiem przy odwzorowaniu wielordzeniowych struktur układowych. Przedstawiona strategia może zwiększyć efektywność docelowego układu poprzez zbalansowanie przepływów.
An approach for realization a NoC-based Multicore chips implementing audio decoder algorithms is presented in this paper. We utilize the proposed multi-path routing algorithm and heuristic algorithms for core mapping in order to balance transfers between cores in the target chip and minimize them in the final realization. The proposed approach are used for generating a NoC-based device model realizing three popular audio decoder algorithms. The experimental results confirming the applicability of proposed approach are provided.
PL
Zaprezentowano podejście do realizacji wielordzeniowych układów opartych na sieciach wewnątrzukładowych implementujących dekodery dźwięku. W tym celu zaproponowano wielościeżkowy algorytm rutingu oraz heurystyki do odwzorowanie rdzeni wyrównujących i zmniejszających transfery między rdzeniami w docelowym układzie. Omówione podejście zostało użyte do wygenerowana modelu układu realizującego trzy popularne algorytmy dekodowania dźwięku. Zaprezentowane badania eksperymentalne potwierdzają zalety proponowanego podejścia.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.