PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Rozpoznawanie głosów na podstawie dyskryminacji amplitudowej sygnału mowy

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
EN
Voice recognition based on amplitude discrimination of speech signal
Języki publikacji
PL
Abstrakty
PL
Artykuł przedstawia nowy sposób opisu sygnałów mowy oraz jego wykorzystanie dla celów rozpoznawania głosu. Doświadczenie z rozpoznawaniem, opisane w artykule, oparto na nagraniach siedmiu głosów (żeńskie i męskie) w trzech różnych językach (polski, arabski i angielski). Głosy były zarejestrowane w warunkach laboratoryjnych (w komorze bezechowej za pomocą wysokiej klasy aparatury rejestrującej) i w pokojowych, za pomocą karty dźwiękowej komputera osobistego i zwykłego mikrofonu (wyższy poziom hałasu). Zaproponowana w artykule nowa metoda rozpoznawania jest wyjątkowo prostą (nieporównywalnie mniejsza złożoność obliczeniowa niż w przypadku innych metod) i skuteczną metodą rozpoznawania. Metoda ta nakłada zdecydowanie mniej ograniczeń co do treści (jak i języka) badanych wypowiedzi niż inne metody. Wykazano bowiem, że za jej pomocą można rozpoznać głos niezależnie od treści wypowiedzi, jak i od jej, mimo iż rozpoznawane wypowiedzi były rozdzielone w sposób «ślepy» (tj. niezależnie od początku i końca słów), to metoda ta daje zadawalające wyniki. Ponadto wypowiedzi nagrywane w warunkach pokojowych były zdecydowanie dobrze rozpoznawane. Pokazano również, że ewentualna realizacja sprzętowa (bądź programowa w języku maszynowym) obliczeń związanych z przedstawioną metodą dyskryminacji amplitudowej jest prosta i co zatem idzie mało kosztowna. W artykule zasygnalizowano jednocześnie przydatność metody dyskryminacji amplitudowej dla celów rozpoznawania języka. Zaproponowana w artykule metoda (jak większość metod rozpoznawania głosu i mowy) jest zależna od właściwości kanału transmisyjnego sygnału, zwłaszcza od jego wzmocnienia. W związku z tym przedstawiono łatwy sposób wyrównania wpływu wzmocnienia kanału poprzez dopasowania poziomu mocy (lub średniej amplitudy) porównywanych sygnałów.
EN
In this correspondence a new method for speech signal presentation applying amplitude discrimination is illustrated, the appliance of this method to voice recognition is discussed. The voice recognition experiment described here is established on seven different voices (female and male) that were registered in three languages (Polish, Arabie and English). Two variants of registration apparatus and environments were considered: anechoic chamber (noise free, high elass microphone and recording apparatus) and room conditions (noisy, PC multimedia were used for registration). Amplitude discrimination method is particularly simple (incomparably lower computing complexity in contrast with other methods) and quite efficient. The presented method definitively imposes fewer limitations on utterances' text and language for it proved to be almost text and language independent operating well and accomplishing good results. Moreover, despite the fact that utterances were «blindly» segmented (i.e. independently of words' boundaries) adequate results were achieved. Furthermore, utterances registered in noisy environment were also defmitely well elassified. In addition, it was shown that hardware implementation (of software using machine language) of computations associated with amplitude discrimination would be simple and therefore inexpensive. Besides, the usability of amplitude discrimination for automatic language identification was also signalized. The introduced method (just like most other voice and speech recognition methods) is sensitive to channel characteristies specially to gain. Therefore, an easy technique for gain influence compensation applying power level or mean amplitude matching (gain normalization) of compared signals is suggested.
Wydawca
Rocznik
Strony
91--103
Opis fizyczny
Bibliogr. 10 poz., rys., tab.
Twórcy
autor
  • Akademia Górniczo-Hutnicza w Krakowie, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
autor
  • Akademia Górniczo-Hutnicza w Krakowie, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Bibliografia
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-aa90e482-a67e-4caf-85e0-366eefb12412
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.