Identyfikatory
Warianty tytułu
Fast method of noisy phonemes identification included in digits spoken in Polish
Języki publikacji
Abstrakty
Niniejszy artykuł jest sprawozdaniem z zakończonego, kolejnego etapu prac autora nad stworzeniem systemu automatycznej identyfikacji cyfr wypowiadanych w języku polskim. Przedstawia on metodę automatycznego rozpoznawania fonemów szumowych przetestowaną na 100 nagraniach cyfr "trzy" i "cztery" pochodzących od mówców różnej płci i w różnym wieku.
This article is the coverage from the last, finished author's research aiming to build automatic speech recognition system for digits spoken in polish. It describes the method of automatic noisy phonemes recognition which was tested on 100 records of digit 3 and 4 received from speakers of different sex and age.
Wydawca
Czasopismo
Rocznik
Tom
Strony
242--245
Opis fizyczny
Bibliogr. 28 poz., rys., tab.
Twórcy
autor
- Politechnika Opolska, Instytut Elektrowni i Systemów Pomiarowych, ul. Sosnkowskiego 31, 45-272 Opole, j.dulas@po.opole.pl
Bibliografia
- [1] Dulas J., Automatyczna segmentacja sygnałów mowy w oparciu o metodę siatek o zmiennych parametrach, PE 1/2010, 229-232
- [2] Dulas J., Metoda siatek o zmiennych parametrach w zastosowaniu do rozpoznawania fonemów mowy polskiej, Rozprawa Doktorska, Politechnika Opolska 2002, 36-42
- [3] Dulas J., Rozpoznawanie jednostek fonetycznych zawierających okresy podstawowe tonu krtaniowego, Konferencja Podstawowe Problemy Metrologii, Sucha Beskidzka 2008
- [4] Dulas J., Automatyczna identyfikacja cyfr dla mówców polskojęzycznych, PE 5/2010, 15-18
- [5] Dulas J., Analiza obwiedni jako parametr wspomagający automatyczną identyfikację wyrażeń, PAK 5/2009, 308-309
- [6] Dulas J., Wspomaganie rozpoznawania wyrazów za pomocą opisu ich obwiedni, Konferencja Podstawowe Problemy Metrologii, Sucha Beskidzka 2009, s.152-156
- [7] Basztura Cz., Rozmawiać z komputerem, Wydawnictwo Format, Wrocław 1992
- [8] KłosJuho P., Hanseok K.,A New state-dependent phonetic tied-mixture model with head-body-tail structured HMM for Real time continous phoneme recognition system , INTERSPEECH 2006, Pittsburgh, USA,1583-1586
- [9] Kłosowski P. Usprawnienie procesu rozpoznawania mowy w oparciu o fonetykę i fonologię języka polskiego, Rozprawa Doktorska, Politechnika Śląska 2000
- [10] Wydra S. Recognition quality improvement In automatic speech recognition system for Polish, EUROCON 2007,Warszawa, 218-223
- [11] Nishida M., Horiuchi Y.,Ichikawa A.,Automatic speech recognition based on adaptation and clustering using temporal-difference learning, INTERSPEECH 2005, Lisbon, Portugal, 285-288
- [12] Liu D., Kiecza D., Srivastava A., Kubala F., Online speaker adaptation and tracking for real-time speech recognition, INTERSPEECH 2005, Lisbon, Portugal, 281-284
- [13] Xiang B., Nguyen L., Guo X. Fu D., The BBN Mandarin Broadcast News Transcription System, INTERSPEECH 2005, Lisbon, Portugal,1649-1652
- [14] Lamel L., Adda G., Bilinski E., Gauvain J.L.,Transcribing lectures and seminars, INTERSPEECH 2005, Lisbon, Portugal,1657-1660
- [15] Trancoso I., Nunes R., Neves L.,Recognition of classroom lectures in european Portuguese INTERSPEECH 2006, Pittsburgh, USA,281-284
- [16] Vali M., Salehi S., Karimi K.,Robust speech recognition by modifying clean and telephone feature vectors using bidirectional neural network, INTERSPEECH 2006, Pittsburgh, USA,2554-2557
- [17] Chang-wen H., Lin-shan L., Extended powered cepstral normalization (P-CN) with range equalization for robust teatures in speech recognition, INTERSPEECH 2007, Antwerp, Belgium, 1106-1109
- [18] Weifeng L., Herve B., Non-linear spectral contrast stretching for in-car speech recognition, INTERSPEECH 2007, Antwerp, Belgium, 1122-1125
- [19] Seymour R., Stewart D., Ming J.Audio-visual integration for robust speech recognition using maximum weighted stream posteriors, INTERSPEECH 2007, Antwerp, Belgium, 654-657
- [20] Zhu B., Hazen J., Glass R., Multimodal speech recognition with ultrasonic sensors, INTERSPEECH 2007, Antwerp, Belgium, 662-665
- [21] Holmberg M., Gelbard D., Ramacher U., Hemmert, Automatic speech recognition with neural spike trains, INTERSPEECH 2005, Lisbon, Portugal, 1253-1256
- [22] Kacalak W., Majewski M., Inteligentny system obustronnej głosowej komunikacji system pomiarowego z operatorem dla technologii mobilnych, PAK 4/2009, 221-224
- [23] Bekiarski A., Pleshkova-Bekiarska S., Pomiar sygnału głosowego za pomocą matrycy mikrofonowej dwuwymiarowej przeznaczonej do audio-wizyjnego sterowania robota, PAK 10/2008, 741-743
- [24] Mięsikowska M., Narzędzie do przetwarzania i analizy sygnału mowy, PAK 12/2007, 43-45
- [25] Mięsikowska M., Aplikacja umożliwiająca nawigację w Internecie za pomocą poleceń mowy, PAK 5/2007, 87-89
- [26] Gołaś A.Problemy sterowania dźwiękiem, I51 Otwarte Seminarium z akustyki, Gdańsk 2004, 37-51
- [27] Neiberg D., Ananthakrishnan G., Gołaś A.Blomberg M., On Acquiring Speech Production Knowledge from Articulatory Measurements for Phoneme Recognition, INTERSPEECH 2009, Brighton, United Kingdom, 1387-1390
- [28] Mesgerani N., Sivaram G.S.V.S., Nemala S.K., Elhilali M., Hermansky H., Discriminant spectrotemporal features for phoneme recognition, INTERSPEECH 2009, Brighton, United Kingdom, 2983-2986
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPW8-0017-0011