Pitch period’s properties and the new method used for finding them

Dulas, J.

Artykuł - szczegóły

Tytuł artykułu

Pitch period’s properties and the new method used for finding them

Autorzy

Dulas J.

Wybrane pełne teksty z tego czasopisma

http://pe.org.pl/

Identyfikatory

Warianty tytułu

Wyszukiwanie okresów podstawowych w tonach kataniowych i wyznaczanie czasu ich trwania

Języki publikacji

Abstrakty

This article describes the pitch’s periods interesting properties. These periods are included in each vowel and voiced consonant. It also describes the new method of pitch period finding and their duration counting. These parameters are very important elements of the automatic speech recognition algorithm worked out by the author.

Artykuł przedstawia interesujące właściwości okresów podstawowych tonu krtaniowego występującego we wszystkich samogłoskach i spółgłoskach dźwięcznych oraz nową metodę ich odnajdywania i wyznaczania ich długości. Poprawne odnajdywanie okresów podstawowych i wyznaczanie czasu ich trwania jest ważnym elementem algorytmu automatycznej identyfikacji słów opracowanego przez autora.

Słowa kluczowe

automatic speech segmentation time domain analysis speech controlling automatic speech recognition

segmentacja mowy automatyczna analiza czasowa sterowanie za pomocą mowy rozpoznawanie mowy automatyczne

Wydawca

Wydawnictwo SIGMA-NOT

Czasopismo

Przegląd Elektrotechniczny

Rocznik

2012

Tom

R. 88, nr 7a

Strony

297--300

Opis fizyczny

Bibliogr. 33 poz., schem., tab., wykr

Twórcy

autor

Dulas J.

Politechnika Opolska, Instytut Elektrowni i Systemów Pomiarowych, ul. Prószkowska 76, 45-758 Opole, j.dulas@po.opole.pl

Bibliografia

[1] Flanagan J.L.,Speech analysis, synthesis and perception, , Speech technologies, Springer Verlag Berlin Heidelberg, 1970
[2] Kacprowski J.,Phisical models of the larynx source, Archives of Acoustics, 1977, vol.12, no 1, pp-47-70
[3] Gerhard D., Pitch extraction and fundamental frequency – history and the current techniques, technical report, University of Regina, 2003
[4] McLeod P.,Wyvill G., A smarter way to find pitch, International computer music conference ICMC’2005.
[5] Massaoud A., Bouzid A., Ellouze N., A new method of Speech estimation and voicing decision based on spectra multi-scale product analisys, Publié dans Signal Processing: An International Journal, Vol. 3(5), September 2009.
[6] Chakraborty R., Sangupta D., Sinha S. Pitch tracking of acoustic signals based on average square mean difference function, Signal image and video processing, Springer London vol.3, number 4, 2008.
[7] Dulas J., Speech recognition based on the grid method and image similarity, Speech technologies, INTECH 2011, 321- 340
[8] Dulas J., Automatyczna identyfikacja cyfr dla mówców polskojęzycznych, PE 5/2010, 15-18
[9] Dulas J., Szybka metoda identyfikacji fonemów szumowych występujących w cyfrach wypowiadanych w języku polskim, PE2/2011, 242-245
[10] Wydra S. Recognition quality improvement In automatic speech recognition system for Polish, EUROCON 2007,Warszawa, 218-223
[11] Dulas J., Automatyczna segmentacja sygnałów mowy w oparciu o metodę siatek o zmiennych parametrach, PE 1/2010, 229-232
[12] Dulas J., Automatic words’ recognition algorithm used for digits clessification, PE 11/2011, 230-233.
[13] Dulas J., Rozpoznawanie jednostek fonetycznych zawierających okresy podstawowe tonu krtaniowego, Konferencja Podstawowe Problemy Metrologii, Sucha Beskidzka 2008
[14] Dulas J., Analiza obwiedni jako parametr wspomagający automatyczną identyfikację wyrażeń, PAK 5/2009, 308-309
[15] Dulas J., Wspomaganie rozpoznawania wyrazów za pomocą opisu ich obwiedni, Konferencja Podstawowe Problemy Metrologii, Sucha Beskidzka 2009, s.152-156
[16] Dulas J., Automatyczne rozpoznawanie cyfr w języku polskim – identyfikacja fonemów szumowych, PE 1/2011
[17] Basztura Cz., Rozmawiać z komputerem, Wydawnictwo Format, Wrocław 1992
[18] Kłosowski P. Usprawnienie procesu rozpoznawania mowy w oparciu o fonetykę i fonologię języka polskiego, Rozprawa Doktorska, Politechnika Śląska 2000
[19] Nishida M., Horiuchi Y.,Ichikawa A.,Automatic speech recognition based on adaptation and clustering using temporal-difference learning, INTERSPEECH 2005, Lisbon, Portugal, 285-288
[20] Liu D., Kiecza D., Srivastava A., Kubala F., Online speaker adaptation and tracking for real-time speech recognition, INTERSPEECH 2005, Lisbon, Portugal, 281-284
[21] Xiang B., Nguyen L., Guo X. Fu D., The BBN Mandarin Broadcast News Transcription System, INTERSPEECH 2005, Lisbon, Portugal,1649-1652
[22] Lamel L., Adda G., Bilinski E., Gauvain J.L.,Transcribing lectures and seminars, INTERSPEECH 2005, Lisbon, Portugal,1657-1660
[23] Trancoso I., Nunes R., Neves L.,Recognition of classroom lectures in european Portuguese INTERSPEECH 2006, Pittsburgh, USA,281-284
[24] Chang-wen H., Lin-shan L., Extended powered cepstral normalization (P-CN) with range equalization for robust teatures in speech recognition, INTERSPEECH 2007, Antwerp, Belgium, 1106-1109
[25] Weifeng L., Herve B., Non-linear spectral contrast stretching for in-car speech recognition, INTERSPEECH 2007, Antwerp, Belgium, 1122-1125
[26] Seymour R., Stewar t D., Ming J.Audio-visual integration for robust speech recognition using maximum weighted stream posteriors, INTERSPEECH 2007, Antwerp, Belgium, 654-657
[27] Zhu B., Hazen J., Glass R., Multimodal speech recognition with ultrasonic sensors, INTERSPEECH 2007, Antwerp, Belgium, 662-665
[33] Neiberg D., Ananthakrishnan G., Gołaś A. Blomberg M., On Acquiring Speech Production Knowledge from Articulatory Measurements for Phoneme Recognition, INTERSPEECH 2009, Brighton, United Kingdom, 1387-1390

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BPOH-0067-0017