PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Wykorzystanie akceleracji sprzętowej przy implementacji metryk podobieństwa tekstów

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
The use of a hardware accelerator for implementation of text resemblance metrics
Języki publikacji
PL
Abstrakty
PL
Artykuł opisuje badania na temat klasyfikatorów tekstów. Zadanie polegało na zaprojektowaniu akceleratora sprzętowego, który przyspieszyłby proces klasyfikacji tekstów pod względem znaczeniowym. Projekt został podzielony na dwie części. Celem części pierwszej było zaproponowanie sprzętowej implementacji algorytmu realizującego metrykę do obliczania podobieństwa dokumentów. W drugiej części zaprojektowany został cały systemem akceleratora sprzętowego. Kolejnym etapem projektowym jest integracja modelu metryki z system akceleracji.
EN
The aim of this project is to propose a hardware accelerating system to improve the text categorization process. Text categorization is a task of categorizing electronic documents into the predefined groups, based on the content. This process is complex and requires a high performance computing system and a big number of comparisons. In this document, there is suggested a method to improve the text categorization using the FPGA technology. The main disadvantage of common processing systems is that they are single-threaded – it is possible to execute only one instruction per a single time unit. The FPGA technology improves concurrence. In this case, hundreds of big numbers may be compared in one clock cycle. The whole project is divided into two independent parts. Firstly, a hardware model of the required metrics is implemented. There are two useful metrics to compute a distance between two texts. Both of them are shown as equations (1) and (2). These formulas are similar to each other and the only difference is the denominator. This part results in two hardware models of the presented metrics. The main purpose of the second part of the project is to design a hardware accelerating system. The system is based on a Xilinx Zynq device. It consists of a Cortex-A9 ARM processor, a DMA controller and a dedicated IP Core with the accelerator. The block diagram of the system is presented in Fig.4. The DMA controller provides duplex transmission from the DDR3 memory to the accelerating unit omitting a CPU. The project is still in development. The last step is to integrate the hardware metrics model with the accelerating system.
Wydawca
Rocznik
Strony
426--428
Opis fizyczny
Bibliogr. 4 poz., rys., tab.
Twórcy
autor
  • AGH Akademia Górniczo-Hutnicza w Krakowie, Katedra Elektroniki, Al. Mickiewicza 30, 30-059 Kraków
autor
  • AGH Akademia Górniczo-Hutnicza w Krakowie, ACK Cyfronet AGH, ul. Nawojki 11, 30-950 Kraków
  • AGH Akademia Górniczo-Hutnicza w Krakowie, Katedra Elektroniki, Al. Mickiewicza 30, 30-059 Kraków
  • AGH Akademia Górniczo-Hutnicza w Krakowie, ACK Cyfronet AGH, ul. Nawojki 11, 30-950 Kraków
  • AGH Akademia Górniczo-Hutnicza w Krakowie, Katedra Elektroniki, Al. Mickiewicza 30, 30-059 Kraków
autor
  • AGH Akademia Górniczo-Hutnicza w Krakowie, ACK Cyfronet AGH, ul. Nawojki 11, 30-950 Kraków
  • AGH Akademia Górniczo-Hutnicza w Krakowie, Katedra Elektroniki, Al. Mickiewicza 30, 30-059 Kraków
Bibliografia
  • [1] Wielgosz M., Koryciak S., Janiszewski M., Pietroń M., Russek P., Jamro E., Dąbrowska-Boruch A., Wiatr K.: Parallel MPI implementation of N-gram algorithm for document comparison. ACACES 2013 : the 9th nternational summer school on Advanced Computer Architecture and Compilation for High-performance and Embedded Systems, Ghent: Academia Press, pp.217-220, 2013.
  • [2] Parapar J., Barreiro A.: Evaluation of Text Clustering Algorithms with N-Gram-Based Document Fingerprints. IRLab, Computer Science Department University of A Coruna, Spain.
  • [3] Norzima Elbegbayan: Winnowing, a Document Fingerprinting Algorithm, TDDC03 Projects, Spring 2005.
  • [4] http://www.xilinx.com
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-74b3fec2-b812-4332-9073-5d6643199053
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.