PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Analiza obwiedni jako parametr wspomagający automatyczną identyfikację wyrażeń

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
The envelope analysis as a useful parameter in automatic phrase identification
Języki publikacji
PL
Abstrakty
PL
W badaniach nad automatycznym rozpoznawaniem sygnałów mowy notuje się stały postęp, choć różnorodność języków utrudnia wprowadzenie jednakowych rozwiązań. Przykładem rozwoju i upowszechnienia metod identyfikacji mowy może być system operacyjny Windows XP, w którym zamieszczono narzędzia do sterowania aplikacjami za pomocą sygnałów głosowych. Brak jednak nadal rozwiązań dla języka polskiego, co sprawia że potrzebne są badania zmierzające do opracowania niezawodnych algorytmów identyfikujących i sterujących. W artykule przedstawiono wyniki badań obwiedni sygnałów mowy, będących cyframi z zakresu 0-9, uzyskanych dla grupy 50-ciu osób różnych płci i w różnym wieku. Celem przeprowadzonych badań było uzyskanie odpowiedzi na pytanie, czy analiza obwiedni może stanowić parametr w procesie automatycznego rozpoznawania sygnałów mowy i czy jest możliwe stworzenie modeli obwiedni dla każdej z cyfr, które byłyby wspólne dla wszystkich (50) mówców.
EN
In scientific research on the speech signal recognition there can be noted great development, although differences between languages make it difficult to work out the same algorithms for all of them. A good example of the big progress in this field can be Windows XP, an operating system which enables controlling some applications by voice (but not in Polish). There is still lack of good working programs controlled by Polish. In this paper the results of investigations on the voice signal envelope are described. There were tested digital recordings, from the range 0 - 9, obtained for 50 persons of different age and sex . The main goal was to find out if the envelope analysis could be helpful in automatic speech recognition. During the investigations basing on the analysis of the digit time characteristic, each digit was divided into parts (from 2 to 5) having the similar envelope. Also the minimum duration and the amplitude range were found for each part. The results are given in Table 1. Table 2 contains the results of fitting the envelope to each digit. It is shown that the envelope patterns are common for all the speakers and digits. Although the envelope analysis is not sufficient alone for automatic speech recognition (some digit patterns fit to the others), it can be used as one of the parameters employed for this purpose.
Wydawca
Rocznik
Strony
308--309
Opis fizyczny
Bibliogr. 10 poz., tab.
Twórcy
autor
Bibliografia
  • [1] M. Steffen: „Częstość występowania głosek polskich”, Biuletyn PTJ XVI, Warszawa 1957 r.
  • [2] R. Tadeusiewicz: „Sygnał mowy”, WKŁ, Warszawa 1988r.
  • [3] Z. Brysiak: „Lektor 4.0 - Mów do mnie jeszcze”, Magazyn Komputerowy CHIP, nr 10/1998.
  • [4] C. Basztura: ”Źródła, sygnały i obrazy akustyczne”, WKŁ, Warszawa 1988r.
  • [5] A. Waibel, K. Bernardin, M. Wolfel: Computer-Supported Human-Human Multilingual Communication, Interspeech conference August 27-31, Antwerp, Belgium, p. 14-21, 2007.
  • [6] J. Li, C.Li: Soft Margin Feature Extraction for Automatic Speech Recognition, Interspeech conference August 27-31, Antwerp, Belgium, p. 30-33, 2007.
  • [7] P. Lucey, G. Potamianos, S. Sridharan: A Unified Approach to Multi-Pose Audio-Visual ASR, Interspeech conference August 27-31, Antwerp, Belgium, p. 650-653, 2007.
  • [8] A. Gołaś: Problemy sterowania dźwiękiem, 51st OSA, Gdańsk 2004.
  • [9] A. Wojciechowska: Kompresja a zrozumiałość sygnału mowy, 51st OSA, Gdańsk 2004.
  • [10] J. Dulas: Rozpoznawanie jednostek fonetycznych zawierających okresy podstawowe tonu krtaniowego, PPM 2008, Sucha Beskidzka.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSW4-0065-0006
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.