PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Modelowanie sygnału mowy uwzględniajace fizyczny mechanizm jej artykulacji

Autorzy
Identyfikatory
Warianty tytułu
EN
Mathematical modelling of human speech articulation
Języki publikacji
PL
Abstrakty
PL
Praca poświęcona jest matematycznym metodom modelowania artykulacji mowy. Szczególną uwagę zwrócono na przypadek, gdy trakt głosowy jest rozgałęziony i w artykulacji uczestniczy np. jama nosowa. Podjęta została próba stworzenia ścisłego modelu matematycznego opisującego propagację dźwięków wewnątrz narządów mowy w sytuacji, gdy właściwy trakt głosowy bocznikowany jest przez wnekę rezonansową. Zaproponowany model został zweryfikowany eksperymentalnie i posłużył do identyfikacji profilu impedancyjnego nardządów mowy podczas artykulacji głosek nosowych. Praca zaczyna się od przedstawienia klasycznych wyników badań dotyczących mowy, które uzyskano na gruncie fonetyki artykulacyjnej i fonologii. Następnie przypomniane zostały prawa fizyki opisujące propagację fal akustycznych, w przypadku gdy zaniedbuje się straty energii wynikające z lepkości powietrza. Równania te po niezbędnych uproszczeniach pozwoliły na przypomnienie równań telegrafistów - równań, które opisują z jednej strony propagację fali akustycznej w rurce o stałym przekroju, a z drugiej strony opisują propagację fali TEM w odcinku bezstratnej linii transmisyjnej o stałej impedancji falowej. Równania te stanowią podstawę wszystkich rozważnych modeli toru głosowego człowieka, począwszy od najstarszego modelu H.L.F. Helmholtza, a skończywszy na najbardziej złożonych modelach cyfrowych. W tej części pracy przedstawiono także rozważania dotyczące stabilności modelu. Następnie opisano liniową predykcję sygnału mowy. Wyprowadzono wzór określąjacy przyczynowy filtr Wienera i zastosowano go do analizy sygnału mowy generowanego zgodnie z opisanymi wcześniej modelem. Rezultatem jest sformułowanie równań normalnych. Rozważany jest także związek filtru Wienera dla sygnału mowy z filtrami kratowymi, co daje jasną interpretację fizyczną parametrów filtru LPC. Kolejny krok to prezentacja algorytmu Levinsona-Durbina, który ma zasadnicze znaczenie dla przetwarzania sygnału mowy. Pozwala on nie tylko na szybkie obliczanie parametrów filtru LPC, ale, niejako przy okazji, pozwala na obliczenie profilu impedancyjnego nierozgałęzionego traktu głosowego. Przedstawione zostają także trzy podstawowe metody estymacji równań normalnych, tzn.: metoda autokorelacji, metoda kowariancji i metoda Burga. Przedstawiono wyniki badań prowadzonych przez autora z wykorzystaniem analizy LPC nad związkiem pomiędzy własnościami akustycznymi samogłosek polskich a ich własnościami artykulacyjnymi. Wyniki te mogą być użyte do usprawnienia procesu rozpoznawania mowy. Przedstawiono także pewną nową interpretację sygnałową parametrów LSP. Parametry LSP znalazły szerokie zastosowanie w konstrukcjach wokoderów generujących strumień danych o szczególnie małej prędkości binarnej. Zagadnienie to zostało omówione na przykładzie wokoderów znormalizowanych przez ITU, a w szczególności na przykładzie wokoderów znormalizowanych przez ITU, a w szczególności na przykładzie wokodera ITU G. 723.1. Następnie sformułowano i przeanalizowano równania rozgałęzionego traktu głosowego. Rozgałęzienie traktu głosowego następuje zawsze wtedy, gdy artykułowana jest głoska nosowa lub unosowiona. Położenie podniebienia miękkiego zmienia się tak, że następuje sprzężenie traktu głosowego z jamą nosową. W sytuacji gdy usta pozostają miękkie, np. podczas artykulacji spółgłoski "m", przepływ powietrza może odbywać się tylko poprzez jamę nosową i tylko ona bierze udział w artykulacji tej głoski. Zasadniczym zagadnieniem jest w tym przypadku opisanie propagacji fal akustycznych w obszarze rozgałęzienia traktu głosowego. Opis ten wymaga sformułowania zespolonego współczynnika odbicia jamy ustnej i prowadzi do modelu ARMA sygnału mowy. W najprostszym przypadku jest to model, którego zera leżą dokładnie na okręgu jednostkowym. Model taki jest dość mało realny i zakłada, że usta są zamknięte i zupełnie nie uczestniczą w artykulacji. Tymczasem jest to nieprawda. Część energii fali akustycznej emitowana jest przez usta mimo prawie całkowitego ich zamknięcia. Prowadzi to do przesunięcia zer modelu sygnału mowy poza okręg jednostkowy. Zaproponowano także algorytm estymacji profilu impedancyjnego rozgałęzionego traktu głosowego na podstawie zarejestrowanego sygnału mowy. Algorytm ten sformułowano w dwóch wersjach. Jedna dotyczy sytuacji gdy zakładamy, że jama ustna jest rezonatorem, w którym nie obserwuje się strat energii, a zatem nie obserwuje sie emisji dźwięków. Druga wersja algorytmu zastępuje to założenie danymi wynikającymi z budowy anatomicznej jamy nosowej człowieka. Zaproponowano model jamy nosowej wraz z modelem emisji dzwięku poprzez nozdrza. Model może być stosowany dla sygnału mowy próbkowanego z częstotliwością 8000Hz. W pracy wykazano, że dzięki temu można usunąć mało realne założenie o braku emisji akustycznych poprzez jamę ustną. Podstawą zaproponowanego algorytmu jest procedura estymacji parametrów modelu ARMA podana przez U. Pillai. Procedura ta: 1) pozwala na wiarygodną ocenę rzędu licznika i mianownika modelu ARMA, 2) jest rozwinięciem idei liniowej predykcji sygnału mowy i korzysta z wyników uzyskanych podczas analizy LPC, 3) pozwala na skuteczną estymację zespolonego współczynnika odbicia od miejsca rozgałęzienia traktu głosowego. Algorytm estymacji profilu traktu głosowego wypróbowano na przykładzie polskich spółgłosek nosowych. Na koniec należy wspomnieć o czasowo rozdzielczym algorytmie estymacji profilu impedancyjnego niejednorodnej linii transmisyjnej na podstawie pomiaru współczynnika odbicia. Powszechnie stosowane w tym celu algorytmy wymagają użycia impulsu, dla którego cza narastania jest dużo krótszy niż czas propagacji fali przez badaną linię. W ostatnim czasie zaproponowano algorytmy, które usuwają tę niedogodność, szczególnie że problem dotyczy układów mikrofalowych. Autorowi niniejszego opracowania udało sie jeden z nich uprościć na tyle, że wymaga on mocy obliczeniowej typowego mikrokontrolera. W rezultacie może być implementowany nawet w niewielkich, przenośnych przyrządach pomiarowych. Algorytm, o którym mowa, został sformułowany przez autora na gruncie teorii mikrofal, ale jest wynikiem jego przemyśleń i doświadczeń w modelowaniu traktu głosowego. Algorytm ten zamieszczono w dodatku B niniejszej pracy.
EN
The book is about mathematical modelling of human speech articulation. The case of forked vocal tract is considered. Particulary when nasal cavity is connected to the mouth cavity and shunts the vocal tract. Author tried to construct an exact mathematical model of sound propagation inside human vocal tract, when the main vocal tract is shunted by resonance cavity. Proposed model have been verified experimentally and used to identify impedance profile of the vocal tract during nasal consonants articulation. The book starts with classical results of scientific investigation concerning human speech articulation obtained by phonetics and phonology. Next fundamental physical laws of sound propagation has been reminded. Energy dissipation mechanisms as viscosity and heat conducted have been omitted. As a result telegrapher equations have been obtained. The telegrapher equations describes not only sound propagation inside uniform lossless pipe but propagation of electromagnetic waves inside lossless transmission line too - TEM modes. The telegrapher equations make up the basis for all models of human speech articulation - from the oldest model originated by H. L. F. Helmholtz, to the most complicated contemporary digital models used, eg. inside GSM telephones. In this part of book considerations about stability of the model have been presented also. Next part of the book is devoted to linear prediction of the speech. The linear, casual Wiener Filter is derived. The Wiener Filter is used for speech analysis. It is assumed that the speech can be modelled by the means of nonuniform lossless transmision line. As a result Normal Equations has been obtained. Relation between Wiener Filter and Lattice Filters for the human speech has been considered also. It gives base for physical interpretation of reflection coefficients and LPC coefficients. In the nest step Levinson-Durbin algorithm has been described. It is the most important algorithm for digital speech processing. It can be used not only for fast solving of Normal Equations but also delivers reflection coefficients need to obtain impedance profile of the vocal tract. The most important methods to obtain Normal Equations has been presented, ie. autocorrelation, covariance and Burg's methods. The results of LPC analysis of Polish vowels obtained by the author has been described. The results connect acoustics features of Polish vowels with articulation features. The results can be used for acceleration of automatic recognition of Polish speech. The new interpretation of LSP coefficients has been introduced. LSP coefficients are widely used in the low bit-rate vocoders. An example of such vocoder, ie. ITU G. 723, is discussed. In the next part of the book forked vocal tract has been considered. During articulation of nasal consonants position of the velum is changed and nasal cavity is attached to the main part of vocal tract. When mouth is closed mouth cavity forms resonance cavity shunting vocal tract. In such configuration consonant is articulated by nasal holes. The main problem is formulation of equations of sounds propagation in the fork domain. It is proposed to use complex reflection coefficient of resonance cavity for smart elimination complexity of equations. Resulted model of speech signal is ARMA model. For the simplest case zeros of the model lies on the unit circle in the Gauss plain. It is unrealistic, which assume that nasal consonant is articulated only by nasal holes. In the reality closed mouth participate in the articulation too. Part of sound waves is emitted by the mouth despite it is completely closed. As a result zeros of the ARMA model are shifted apart the unit circle. In the book an algorithm for the impedance profile identification of the forked vocal tract has been proposed. The algorithm is based on proposed ARMA model of speech production. The algorithm is formulated in two versions. The first is intended for the ARMA model with zeros on the unit circle, ie. it can be used for impedance profile identification in the case lossless resonance cavity. In the second version of the algorithm the assumption of lossless cavity is replaced by standard nasal cavity model. Standard nasal cavity model can by obtained from literature and here it is adapted to processing of 8000 Hz sampled speech. Standard model of nasal cavity eliminates unrealistic about lossless resonance mouth cavity. The base of the identification algorithm is ARMA model identification procedure published by U. Pillai. The procedure: 1) can by used for reliable estimation of order of numerator and denominator of the ARMA model; 2) it is an expansion of linear prediction of speech and is based on the LPC coefficients computation; 3) can be used for reliable estimation of complex reflection coefficient of resonance cavity. The algorithm of forked vocal tract impedance profile identification has been tested on Polish nasal consonants. The last achievement of the author is algorithm of impedance profile identification of nonuniform lossless transmission line based on reflected wave detection. The most widespread algorithms used in such a case utilize as an excitation pulse shaped waverform with raise time at least one order of magnitude shorter then delay time of the line under investigation. Proposed algorithm can utilize waveform of any shape and duration greater than delay time of the line. In the same time the algorithm is not very complex and can be implemented even on small and simple microcontroler. The algorithm is given in the Appendix B.
Słowa kluczowe
Rocznik
Tom
Strony
9--188
Opis fizyczny
bibliogr. 308 poz.
Twórcy
Bibliografia
  • [1] Abramson N. Teoria informacji i kodowania. Państwowe Wydawnictwo Naukowe, Warszawa 1969.
  • [2] Akaike H. Use of statistical models for time series analysis. Proceedings of IEEE ICASSP, 1986, pp. 3147-3155.
  • [3] Akaike H. A new look at the statistical model identification. IEEE Transactions on Automatic Control, Vol. AC-19, No. 6, December 1974, pp. 716-723.
  • [4] Alexander S.T. (Tom), Rhee Z. M. Analytical finite precision results for Burg’s algorithm and the autocorrelation method for linear prediction. IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-35, No. 5, May 1987, pp. 626-635.
  • [5] Amin M. G. A comparision between two measures of convergence in recursive window based spectrum estimation. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 8, August 1990, pp. 1457-1459.
  • [6] Anderson B.D.O., Moore J.B. Filtracja optymalna. Państwowe Wydawnictwo Naukowo-Techniczne, Warszawa 1984.
  • [7] Annamalai K., Puri I. K. Advanced Thermodynamics Engineering. CRC Press, Boca Ration, London 2002.
  • [8] Atal B. S. Determination of the vocal tract shape directly from the speech wave. J. Acoust. Soc. Am., Vol.47, 1970, pp. 65(A).
  • [9] Atal B. S. Predictive coding of speech at low bit rates. IEEE Transactions on Communications, Vol. COM-30, No. 4, April 1982, pp. 600-614.
  • [10] Atal B. S., Cox R. B., Kroon P. Spectral quantization and interpolation for CELP coders. Proceedings of ICASSP, May 1989, pp. 69-72.
  • [11] Atal B. S., Rioul O. Neural networks for estimating articulatory positions from speech. J. Acoust. Soc. Am., Vol. 86, suppl. 1, S67, 1989.
  • [12] Bäckström T., Alku P. All-pole modeling technique based on weighted sum of LSP polynomials. IEEE Signal Processing Letters, Vol. 10, No. 6, p. 180-183, June 2003.
  • [13] Backus J. Small vibration theory of the clarinet. J. Acoust. Soc. Am., Vol. 35, No. 3, 1963, pp. 591-599.
  • [14] Baer T., Gore J. C., Gracco L. C., Nye P. W. Analysis of vocal tract shape and dimensions using magnetic resonance imaging: vowels. J. Acoust. Soc. Am., Vol. 90, No. 2, pt. 1, 1991, pp. 799-828.
  • [15] Banbrook M., McLaughlin S., Mann I. Speech characterization and synthesis by nonlinear methods. IEEE Transactions on Speech and Audio Processing, Vol. 7, No. 1, January 1999, pp. 1-17.
  • [16] Banbrook M., Ushaw G., McLaughlin S. How to extract Lyapunov exponents from short and noisy time series. IEEE Transactions on Signal Processing, Vol. 45, No. 5, May 1997, pp. 1378-1382.
  • [17] Barnwell T. P. Windowless techniques for LPC analysis. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 4, August 1980, pp. 421-427.
  • [18] BASZTURA C. Porozmawiać z komputerem. Wydawnictwo FORMAT, 1992.
  • [19] Beex A. A. (Louis), Anisur Rahman MD.. On averaging Burg spectral estimators for segments. IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. 34, No. 6, December 1986, pp. 1473-1484.
  • [20] Bell B. M., Percival D. B. A two step Burg algorithm. IEEE Transactions on Signal Processing, Vol. 39, No. 1, January 1991, pp. 1279-1281.
  • [21] Benade A. H. Fundamentals of Musical Acoustics. Dover, New York 1990.
  • [22] Benni T. Fonetyka opisowa języka polskiego. Zakład Narodowy Imienia Ossolińskich - Wydawnictwo, Wrocław 1959.
  • [23] Blicharska B. Fizyka głosu. Foton, styczeń-luty 1997, ss. 29-33.
  • [24] Borg G. Eine Umkehrung der Sturm-Liouvilleschen Eigenwertaufgabe. Acta Mathematica, Vol. 78, 1946, pp. 1-96.
  • [25] Bou-Ghazale S. E., Hansen J. H. L. A comparative study of traditional and newly proposed features for recognition of speech under stress. IEEE Transactions on Speech and Audio Processing, Vol. 8, No. 4, July 2000, pp. 429-442.
  • [26] Bruzzone S. M. K. On some suboptimum ARMA spectral estimators. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 6, December 1980, pp. 753-755.
  • [27] BURG J. P. Maximum Entropy Spectral Analysis. In Proceedings of the 37th Meeting of the Society of Exploration Geophysicists, 1967.
  • [28] Burg J. P. Maximum entropy spectral analysis. PhD thesis, Stanford University, 1975.
  • [29] Byrnes C. L, Enqvist P., Lindquist A. Cepstral coefficients, covariance lags, and pole-zero models of finite data strings. IEEE Transactions on Signal Processing, Vol. 49, No. 4, April 2001, pp. 677-693.
  • [30] Byron F. W., Fuller R. W. Matematyka w fizyce klasycznej i kwantowej. Państwowe Wydawnictwo Naukowe, Warszawa 1975.
  • [31] Capon J. High-resolution frequency-wavenumber spectrum analysis. Proceedings of IEEE, Vol. 57, No. 8, August 1969, pp. 1408-1418.
  • [32] Chiang D. Factorization of high degree polynomials - A numerical solution. IEEE Transactions on Circuits and Systems - Fundamental Theory and Applications, Vol. 43, September 1996, pp. 792-794.
  • [33] Childers D. G. Speech Processing and Synthesis Toolboxes. John Willey & Sons, Inc., New York 2000.
  • [34] Chojcan J., Izydorczyk J. Speech and wavelets. In Industrial Control And Management Methods: Theory And Practice: Preprints of the Dycoman’s Workshop, Prague, October 5-71995, pp. 31-35.
  • [35] Chojcan J., Rutkowski J. Zbiór zadań z teorii informacji i kodowania, wyd. V, Skrypt Pol.Śl. Nr 2018, Gliwice 1997.
  • [36] Claerbout I. F. Synthesis of a layered medium from its acoustic transmission response. Geophysics, 33, pp. 264-269, 1968.
  • [37] Claerbout J. Fundamentals of Geophysical Data Processing. McGraw-Hill, New York 1976.
  • [38] COHEN L. Time-Frequency Analysis. Prentice-Hall Inc., Englewood Cliffs, NJ 1995.
  • [39] Collin R. E. Prowadzenie fal elektromagnetycznych. Wydawnictwo Naukowo-Techniczne, Warszawa 1960.
  • [40] Cox R. V. Three new speech coders from the ITU cover a range of applications. IEEE Communications Magazine, Vol. 35, pp. 40-47, 1997.
  • [41] Cox R. V. Speech Coding Standards. WW.B.Kleijn, K.K.Paliwal, [red.]. Speech Coding and Synthesis. Amsterdam, The Netherlands: Elsevier 1995, pp.49-78.
  • [42] Cybenko G. On the eigenstructure of Toeplitz matrices. IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-32, No. 4, August 1984, pp. 918-921.
  • [43] Cybenko G. Locations of zeros of predictor polynomials. IEEE Transactions on Automatic Control, Vol. AC-27, No. 1, February 1982, pp. 235-237.
  • [44] Cybenko G. Round-off error propagation in Durbin’s, Levinson’s, and Trench’s algorithms. In ICASSP-79, 1979 International Conference on Acoustics, Speech, and Signal Processing, Vol. 4Iss., April 1979, pp. 498- 501.
  • [45] Czogala E., Łęski J. Fuzzy and Neuro-Fuzzy Inteligent Systems. Physica-Verlag, A Springer Verlag Company, 2000.
  • [46] Dąbrowski A. Transmission of effective pseudopower in multirate signal processing. Proc. IEEE Int. Conf. Acoust. Sp. Sig. Proc. ICASSP-89, Vol. 2, Glasgow, UK 23-26 May 1989, pp. 1267-1270.
  • [47] Dąbrowski A., Olejniczak M. Floating point quasi maximum accuracy arithmetics for digital signal processing. Proc. IEEE Int. Symp. on Circuits and Systems ISCAS-94, Vol. 2, London, UK, 30 May-2 Jun 1994, pp. 489-492.
  • [48] Dąbrowski A. [red.]. Przetwarzanie sygnałów przy użyciu procesorów sygnałowych. Wydawnictwo Politechniki Poznańskiej, Poznań 2000.
  • [49] Deller J.R., Jr., Hansen J.H.L., Proakis J.G. Discrete Time Processing of Speech Signals. IEEE Press, New York 2000.
  • [50] Delsarte P., Genin Y. V. The split Levinson algorithm. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 3, June 1986, pp. 470-478.
  • [51] Drygajlo A., CARNERO B. Integrated speech enhancement and coding in the time-frequency domain. Proc. IEEE Int. Conf. Acoust. Sp. Sig. Proc. ICASSP-97, 1997, pp. 1183-1186.
  • [52] Du J., Warner G., Vallow E., Hollenbach T. High-performance DSPs. IEEE Signal Processing Magazine, Vol. 17, No.2:pp. 16-26, March 2000.
  • [53] Dudley H. The vocoder. Bell Labs Rec., Vol. 17, pp. 122-126, 1939.
  • [54] Dukiewicz L. Analiza mowy nagranej wstecz. W В. Rocławski, [red.]. Wybór materiałów do studiowania fonologii, fonetyki, fonotaktyki i fonostatystyki języka polskiego. Gdańsk, 1979, s.161.
  • [55] DURBIN J. Efficient estimation of parameter in moving average models. Biometrika, Vol. 46, 1959, pp. 306-316.
  • [56] Dłuska M. Fonetyka polska. Artykulacje głosek polskich. Państwowe Wydawnictwo Naukowe, Warszawa-Kraków 1981.
  • [57] El-Jaroudi A., Makhoul J. Discrete all-pole modeling. IEEE Transactions on Signal Processing, Vol. 39, No. 2, February 1991, pp. 411-423.
  • [58] Erkelens J.S., Broersen P.M.T. Bias propagation in the autocorrelation method of linear prediction. IEEE Transactions on Speech and Audio Processing, Vol. 5, No. 2, 1997, pp. 116-119.
  • [59] Eyre J. The Digital Signal Procesor Derby. IEEE Spectrum, Vol. 38, No. 6:pp. 62-68, June 2001.
  • [60] Eyre J., Bier J. DSP Processors Hit the Mainstream. IEEE Computer, Vol. 31(8):pp. 51-59, August 1998.
  • [61] Eyre J., Bier J. The Evolution of DSP Processors. IEEE Signal Processing Magazine, Vol. 17, No. 2:pp. 43-51, March 2000.
  • [62] Ferraz de Campos Neto SimŃo, Karapetian W. Performance of ITU-T G.729 8 kb/s CS-ACELP speech codec with nonvoice narrowband signals. IEEE Communications Magazine, Vol. 35, No. 9, September 1997, pp. 82-91.
  • [63] Feyman R. Г., Leighton R. В., Sands M. Feynmana wykłady z fizyki, tom II - Część 2, Państwowe Wydawnictwo Naukowe, Warszawa 2001.
  • [64] Fletcher N. H., Rossing T. D. The Physics of Musical Instruments. Springer, New York 1991.
  • [65] Fridman J. Sub-word parallelism in digital signal processing. IEEE Signal Processing Magazine, Vol. 17, No. 2:pp. 27-35, March 2000.
  • [66] Friedlander B., Porat B. The modified Yule-Walker method for ARMA spectral estimation. IEEE Transactions on Aerospace and Electronics Systems, Vol. AES-20, No. 2, March 1984, pp. 158-172.
  • [67] Fujimura O. Analysis of nasal consonants. J. Acoust. Soc. Am., Vol. 34, Dec 1962, pp. 1865-1875.
  • [68] Gardner W., Rao B.D. Noncasual all-pole modeling of voiced speech. IEEE Transactions on Speech and Audio Processing, Vol. 5, No. 1, January 1997, pp. 1-10.
  • [69] Gatherer A., Stetzler T., Ausländer E. The History of DSP Based Architectures in Second Generation Cellular Handsets. W A.Gatherer, E.Ausländer, [red.]. The Application of Programmable DSPs in Mobile Communications. New York: John Wiley & Sons, 2002, pp. 11-22.
  • [70] Georgiou T.T., Khargonekar P.P. Linear fractional transformations and spectral factoryzation. IEEE Transactions on Automatic Control, Vol. AC-31, No. 4, April 1986, pp. 345-347.
  • [71] Ghitza O. Audytory models and human performance in tasks related to speech coding and speech recognition. IEEE Transactions on Speech and Audio Processing, Vol. 2, No. 1, Part II, January 1994, pp. 115-132.
  • [72] Goldberg R., Riek L. A Practical Handbook of Speech Coders. CRC Press, Boca Raton 2000.
  • [73] Golub G. H., Reinsch C. Singular value decomposition and least squares solution. Numerical Mathematics, Vol. 14, 1970, pp. 403-420.
  • [74] Goodman D.M., Ekstrom M.P. Multidimensional spectral factorization and unilateral autoregressive models. IEEE Transactions on Automatic Control, Vol. AC-25, No. 2, April 1980, pp. 258-262.
  • [75] Gopinath B., Sondhi M. M. Determination of the shape of the human vocal tract by acoustic measurements. Bell Syst. Tech. J., Vol. 49, No. 6, 1970, pp. 1195-1214.
  • [76] Goupillaud P.L. An approach to inverse filtering of near-surface layer effects from seismic records. Geophysics, 26, pp. 754-760, 1961.
  • [77] Gray A.H.,Jr., Wong D.Y. The Burg algorithm for LPC speech analysis/synthesis. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 6, December 1980, pp. 609-615.
  • [78] Gray R. M., Buzo A., Gray A.H., Jr., Matsuyama Y. Distortion measures for speech processing. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 4, August 1980, pp. 367-376.
  • [79] Gueguen C., Grenier Y., Giannella F. Factorial linear modelling, algorithms and applications. Proceedings of IEEE ICASSP, 1980, pp. 618-621.
  • [80] Gupta K.C., Garg R., Bahl I., Bhartia P. Microstrip Lines and Slotlines. Artech House, Boston-London 1996.
  • [81] HÄRMÄ A. Linear predictive coding with modified filter structures. IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 8, November 2001, pp. 769-777.
  • [82] Hasegawa-Johnson F. Line spectral frequencies are poles and zeros of the glottal driving-point impedance of a discrete mached-impedance vocal tract model. Journal of Acoustic Society of America, Vol. 108, p. 457-460, 2000.
  • [83] Haykin S. Adaptive Filter Theory. Prentice Hall, Upper Saddle River, New Jersey 1986.
  • [84] Haykin S. Advances in Spectrum Analysis and Array Processing. Prentice-Hall Inc., Englewood Cliffs, NJ 1991.
  • [85] HAYKIN S. Systemy telekomunikacyjne, tom 1,2, Wydawnictwo Komunikacji i Łączności, Warszawa 1998.
  • [86] Hays H. M. Statistical Digital Signal Processing and Modeling. John Wiley & Sons Inc., New York 1996.
  • [87] Helmholtz H. L. F. von. Die Lehre von den Tonempfindungen als physiologische Grundlage der Theorie der Music. F.Vieweg und Sohn, Braunschweig 1895.
  • [88] Herring R. W. The cause of line splitting in Burg maximum-entropy spectral analysis. IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-28, No. 6, December 1980, pp. 692-701.
  • [89] Homayounfar K. Rate adaptive speech coding for universal multimedia access. IEEE Signal Processing Magazine, Vol. 20, March 2003, pp. 30-39.
  • [90] Hsue C.-W., Pan T.-W. Reconstruction of nonuniform transmission lines from time-domain reflectometry. IĘEE Transactions on Microwave Theory and Techniques, Vol. 45, No. 1, January 1997, pp.32-28.
  • [91] Ishii T.K. Transmission lines. The Circuits and Filters Handbook. CRC Press and IEEE Press, 1995, pp. 1180-1182.
  • [92] Itakura F. Line spectrum representation of linear predictive coefficients. Journal of Acoustic Society of America, Vol. 57 Suppl., No. 1, p.S35, 1975.
  • [93] Itakura F., Saito S. A statistical method for estimation of speech spectral density and formant frequencies. Electr. Commun., Vol. 53-A, 1970, pp. 36-43.
  • [94] ITU-T. Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s. ITU-T Recommendation G.723.1, 03/1996.
  • [95] ITU-T. 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (AD-PCM). ITU-T Recommendation G.726, 1990.
  • [96] ITU-T. Coding of Speech at 16 kbit/s Using Low-Delay Code Excited Linear Prediction. ITU-T Recommendation G.728, 1993.
  • [97] ITU-T. Coding of Speech at 8 kbit/s Using Conjugate Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP). ITU-T Recommendation G.729, 1993.
  • [98] ITU-T. Pulse Code Modulation (PCM) of Voice Frequencies. ITU-T Recommendation G.711, 1993.
  • [99] ITU-T. Methods for Subjective Determination of Transmission Speech Quality. ITU-T Recommendation P.800, August 1996.
  • [100] ITU-T. Methods for objective and subjective assessment of quality. ITU-T Recommendation P.861, February 1998.
  • [101] IZYDORCZYK J. A technique for modeling vocal-tract acoustic properties. Proceedings of IFA C Workshop on Programmable Devices and Systems PDS2003, Ostrava, 11-13 February 2003, pp. 370-373.
  • [102] Izydorczyk J. Laboratorium procesorów sygnałowych Instytutu Elektroniki Politechniki Śląskiej. Procesory stałoprzecinkowe. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXIX, Nr 4, 1996, ss. 235-241.
  • [103] Izydorczyk J. Analog Devices ADSP2100 Family. DSP & Multimedia Technology, Vol. 5, N0.5, 1996, ss. 32-39.
  • [104] Izydorczyk J. Procesory sygnałowe, części czyli historia i teraźniejszość. ZNPol.Śl., s.”Elektronika”, z.12, 2000, ss. 135-165.
  • [105] Izydorczyk J. Procesory sygnałowe, część 2 czyli niedaleka przyszłość. ZNPol.Śl., s.”Elektronika”, z.12, 2000, ss. 167-200.
  • [106] IZYDORCZYK J. Telefony. Delta, Nr 7, 2001, ss. 1-3.
  • [107] Izydorczyk J. Hydrodynamc model of the human speech production and its applications. In Proceedings of the 4th International Conference on Quality, Reliability, and Maintenance, St. Edmund Hall, University of Oxford, 2002, pp. 249-252. Professional Engineering Publishing Limited.
  • [108] Izydorczyk J. Kompresja sygnału mowy dla potrzeb aplikacji multimedialnych. Materiały konferencji naukowo-technicznej TELPRZEM 2001, Gliwice, 21-22.06.2001, ss. 109-123.
  • [109] Izydorczyk J. An application of LPC technique and wavelets to speech coding. Materiały XVIIIKK TOiUE, Polanar Zgorzelisko, Polska, 25-27.X.1995, ss. 419-424.
  • [110] Izydorczyk J. Fixed point DSP processors from Analog Devices. Proceedings of IFAC Workshop on Programmable Devices and Systems PDS’95, Gliwice, 9-10 November 1995, ss. 21-28.
  • [111] Izydorczyk J. Comments on time-domain reflectometry using arbitrary incident waveforms. IEEE Transactions on Microwave Theory and Techniques, Vol. 51, No. 4, April 2003, pp. 1296-1298.
  • [112] Izydorczyk J. Kierunki rozwoju procesorów sygnałowych. Prace Komisji Naukowych PAN Oddział w Katowicach. Zeszyt 25, PAN, Katowice2001, ss. 62-66.
  • [113] Izydorczyk J. Co nowego w krainie DSP? Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXXIV, Nr 4, kwiecień 2001, ss. 247-257.
  • [114] Izydorczyk J. An Implementation of Human Vocal Tract Model on Carmel DSP. Proceedings of IFAC Workshop on Programmable Devices and Systems PDS2001, Gliwice, November 22-23 2001, pp. 56-60.
  • [115] Izydorczyk J. Czy postęp telekomunikacji przyczyni się do zagłady procesorów sygnałowych? Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXXIII, Nr 10, październik 2000, ss. 743-754.
  • [116] Izydorczyk J., Biernacki S. Kompresja sygnału mowy RPE-LTP. Implementacja w systemie z procesorem sygnałowym ADSP 21020. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji’2001, tomB, Bydgoszcz, wrzesień 2001, ss. 205-212.
  • [117] Izydorczyk J., Chojcan J. Synteza mowy polskiej. Materiały konferencyjne XXI Seminarium z Podstaw Elektrotechniki i Teorii Obwodów, Gliwice-Ustroń, 20-23.V. 1998, ss. 45-54.
  • [118] IZYDORCZYK J., Dustor A. Rozpoznawanie mówców. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXXVI, Nr 2-3, luty 2003, ss. 71-76.
  • [119] Izydorczyk J., Kłosowski P. Wytwarzanie mowy syntetycznej. InfoTel, Nr3, lipiec-wrzesień 1999, ss. 84-87.
  • [120] Izydorczyk J., Kłosowski P. Allophonic speech synthesis for Polish. Materiały konferencyjne Krajowej Konferencji Teorii Obwodów i Układów Elektronicznych , Kołobrzeg, 1997, ss. 535-541.
  • [121] Izydorczyk J., Kłosowski P. Mówiące przyrządy. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXXI, Nr3 (marzec), 1998, ss. 185-187.
  • [122] Izydorczyk J., Kłosowski P. Acoustic properties of polish vowels. Bulletin of the Polish Academy of Sciences,'’Technical Sciences, Vol. 47, BAPTA9 47 (1) 1-114, 1999, pp. 29-38.
  • [123] Izydorczyk J., Kłosowski P. Base acoustic properties of polish speech. In Proceedings of IFAC Workshop on Programmable Devices and Systems PDS2001, Gliwice, November 22-23 2001, pp. 61-66.
  • [124] Izydorczyk J., Kłosowski P. Alofoniczna synteza mowy polskiej. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji’1997, tom D, Bydgoszcz, wrzesień 1997, ss. 66-72.
  • [125] IZYDORCZYK J., Płonka G. Przetwarzanie sygnałów i procesory sygnałowe w Instytucie Elektroniki Politechniki Śląskiej. Aspekty dydaktyczne. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne, Rocznik LXIX, Nr3, 1996, ss. 182-185.
  • [126] Izydorczyk J., Płonka G., Tyma G. Teoria sygnałów. Wstęp. HELION, Gliwice 1999.
  • [127] Izydorczyk J., Zielonka A. Kompresja sygnału mowy zgodna z normą G.728. Implementacja w systemie z procesorem TMS320C31. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji’2001, tom B, Bydgoszcz, wrzesień 2001, ss. 221-229.
  • [128] JASSEM W. Mowa a nauka o łączności. Państwowe Wydawnictwo Naukowe, Warszawa 1974.
  • [129] Jassem W. Podstawy fonetyki akustycznej. Państwowe Wydawnictwo Naukowe, Warszawa 1973.
  • [130] Kabal P., Ramachandran R. P. A computation of line spectral frequencies using Chebyshev polynomials. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 6, December 1986, pp. 1419-1426.
  • [131] Kaczorek T. Macierze w automatyce i elektrotechnice. Wydawnictwo Naukowo-Techniczne, Warszawa 1984.
  • [132] Kaminsky I., Materka A. Automatic source identification of monophonic musical instrument sounds. Proceedings of IEEE International Conference on Neural Networks, Vol.l, 27 Nov.-l Dec. 1995, pp. 189-194.
  • [133] Kanasewich E. R. Time Sequence Analysis in Geophysics. University of Alberta Press, Edmonton 1975.
  • [134] Karasalo I. Estimating the covariance matrix by signal subspace averaging. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 1, February 1986, pp. 8-12.
  • [135] Karnjanadecha M., Zahorian S. A. Signal modeling for high-performance robust isolated word recognition. IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 6, September 2001, pp. 647-654.
  • [136] Kay S. M. Modem Spectral Estimation: Theory and Application. Prentice-Hall Inc., Englewood Cliffs, NJ 1988.
  • [137] KEEFE D. H. Physical modeling of wind instruments. Comput. Music J., Vol. 16, No. 4, 1992, pp. 57-73.
  • [138] Keefe D. H. Wind-instrument reflection function measurement in the time domain. J. Acoust. Soc. Am., Vol. 99, No. 4, 1996, pp. 2370-2381.
  • [139] Кім H.K., Choi S.H., Lee H.S. On approximating line spectral frequencies to LPC cepstral coefficients. IEEE Transactions on Speech and Audio Processing, Vol. 8, No. 2, March 2000, pp. 195-199.
  • [140] Кім H.K., Lee И. S. Interlacing properties of line spectrum pair frequencies. IEEE Transactions on Speech and Audio Processing, Vol. 7, No. 1, January 1999, pp. 87-91.
  • [141] Kiritani S., Itoh K., Fujimura O. Tonque pellet tracking by a computer-controlled X-ray microbeam system. J. Acoust. Soc. Am., Vol. 57, No. 6, pt. 2, 1975, pp. 1516-1520.
  • [142] Kleijn W.B., Bäckström T., Alku P. On line spectral frequencies. IEEE Signal Processing Letters, Vol. 10, No. 3, p. 75-77, March 2003.
  • [143] Kleijn W. B., Krasinski D. J., Ketchum R. H. Fast methods for the CELP speech coding algorithm. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 8, August 1990, pp. 1330-1342.
  • [144] Klema V. C., Laub A. J. The singular value decomposition: Its computation and some applications. IEEE Transactions on Automatic Control, Vol. AC-25, No. 2, April 1980, pp. 164-176.
  • [145] Koehler E., Taner M. T. Direct and inverse problems relating reflection coefficients and reflection response for horizontally layered media. Geophysics, 42, 1977, pp. 1199-1206.
  • [146] KONDOZ A. M. Digital Speech. Coding for Low Bit Rate Communications Systems. John Wiley & Sons, Chichester 1994.
  • [147] Konstantininides K., Yao K. Statistical analysis of effective singular values in matrix rank determination. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-36, No. 5, May 1988, pp. 757-763.
  • [148] Kłosowski P. Usprawnienie procesu rozpoznawania mowy w oparciu o fonetykę i fonologię języka polskiego. Praca doktorska, Politechnika Śląska w Gliwicach, 2000.
  • [149] Kłosowski P. Programowa synteza mowy polskiej. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji, tom A, Bydgoszcz 1996, pp. 297-305.
  • [150] Kłosowski P. Automatyczne rozpoznawanie obrazów akustycznych sygnału mowy. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji, tom B, Bydgoszcz 1998, pp. 245-252.
  • [151] Kłosowski P. Usprawnienie procesu rozpoznawania mowy w oparciu o cechy dystynktywne fonemów języka polskiego. Materiały konferencyjne Krajowego Sympozjum Telekomunikacji, tom B, Bydgoszcz 1999, pp.353-359.
  • [152] Kowalczyk B. Macierze Uch zastosowania. Wydawnictwo Naukowo-Techniczne, Warszawa 1976.
  • [153] Kozin F., Nakajima F. The order determination problem for linear time-varying AR models. IEEE Transactions on Automatic Control, Vol. AC-25, No. 2, April 1980, pp. 250-257.
  • [154] Krakowski M. Elektrotechnika teoretyczna. Państwowe Wydawnictwo Naukowe, Warszawa 1991.
  • [155] Kucharczyk P. [red.]. Matematyka. Poradnik Inżyniera, tom l. Wydawnictwo Naukowo-Techniczne, Warszawa 1986.
  • [156] Kumar S. S., Mullick S. Nonlinear dynamical analysis of speech. J. Acoust. Soc. Am., Vol. 100, 1996, pp. 615-629.
  • [157] Kumaresan R., Wang Y. On the duality between line-spectral frequencies and zero-crossings of signals. IEEE Transactions on Speech and Audio Processing, Vol. 9, No. 4, May 2001, pp. 458-461.
  • [158] Kumura T., Ikekawa M., Yoshida M., Kuroda I. VLIWDSP for Mobile Applications. IEEE Signal Processing Magazine, Vol. 19, No. 4, July 2002, pp. 10-21.
  • [159] Landau L.D., Lifszyc E.M. Hydrodynamika. Państwowe Wydawnictwo Naukowe, Warszawa 1994.
  • [160] Lang S. W., McClellan J. H. Frequency estimation with maximum entropy spectral estimators. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 6, December 1980, pp. 716-724.
  • [161] Lee C.-H. On robust linear prediction of speech. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 36, No. 52, May 1988, pp. 642-650.
  • [162] Lee C., Hyun D., Choi E., Go J., Lee C. Optimizing feature extraction for speech recognition. IEEE Transactions on Speech and Audio Processing, Vol. 11, No. 1, January 2003, pp. 80-87.
  • [163] Leja F. Funkcje zespolone. Państwowe Wydawnictwo Naukowe, Warszawa 1979.
  • [164] Leja F. Rachunek różniczkowy i całkowy. Państwowe Wydawnictwo Naukowe, Warszawa 1959.
  • [165] LIM L, Lee B. G. Lossless pole-zero modeling of speech signals. IEEE Transactions on Speech and Audio Processing, Vol. 1, No. 3, July 1993, pp. 269-276.
  • [166] Lim L, Lee B. G. Losy pole-zero modeling for speech signals. IEEE Transactions on Speech and Audio Processing, Vol. 4, No. 2, March 1996, pp. 81-88.
  • [167] LJUNG L. System Identification: Theory for the User. Prentice-Hall Inc., Englewood Cliffs, NJ 1987.
  • [168] Ljung L., Glad T. Modeling of Dynamic Systems,. Prentice-Hall Inc., Englewood Cliffs, NJ 1994.
  • [169] Łęski J. M. Robust weighted averaging. IEEE Transactions on Biomedical Engineering, Vol. 49, No. 8, August 2002, pp. 796-804.
  • [170] Maeda S. A digital simulation method of the vocal-tract system. Speech Communication, Vol. 1, 1982, pp. 199-229.
  • [171] Maeda S. The role of the sinus cavities in the production of nasal vowels. Proceedings of ICASSP’82, 1982, pp. 911-914.
  • [172] Mahon J.P., Elliot R. S. Tappered transmission lines with controlled ripple response. IEEE Transactions on Microwave Theory and Techniques, Vol. 38, No. 10, October 1990, pp. 1415-1420.
  • [173] Makhoul J. Linear prediction: A tutorial review. Proceedings of the IEEE, Vol. 63(4), April 1975, pp. 561-580,.
  • [174] Makhoul J. Spectral linear prediction: Properties and applications. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-23, No. 3, June 1975, pp. 283-296.
  • [175] Makhoul J. Stable and efficient lattice methods for linear prediction. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 25, No. 10, October 1977, pp. 423-428.
  • [176] Markiel J.D., Gray A. H.,Jr. Linear Prediction of Speech. Springer-Verlag, New York 1976.
  • [177] Marple L. A new autoregressive spectrum analysis algorithm. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 28, No. 4, August 1980, pp. 441-454.
  • [178] Marple S. L., Jr. Digital Spectral Analysis with Applications. Prentice-Hall Inc., Englewood Cliffs, NJ 1987.
  • [179] Materka A. Smoothness constraints for training neural network-based parameter estimators. Proc. 5th Australian Conf. Neural Networks, Brisbane, Australia 1994, pp. 210-213.
  • [180] Materka A. Application of artificial neural networks to parameter estimation of dynamical systems. Proc, of IEEE Int. Conf. Instrum. Meas. Techno/., Hamamatsu, Japan 1994, pp. 123-126.
  • [181] Materka A. Fast and accurate identification of electronic circuit parameters using regularised feedforward neural networks. Proc. Int. Joint Conf. Neural Networks, Nagoya, Japan 1993, pp. 509-512.
  • [182] Materka A. Modular artificial neural network architecture for accurate estimation of dynamical system parameters. Materiały konferencyjne XVIII Krajowej Konferencji Teoria Obwodów i Układy Elektroniczne, Polana-Zgorzelisko, Poland 1995, pp. 635-640.
  • [183] Materka A. Application of neural networks to dynamic system parameter estimation. Proc. If th Int. Conf.'IEEE Eng. Med. Biol. Soc., Vol.3, Paris, France 1992, pp. 1042-1044.
  • [184] Materka A., Mizushina S. Parametric signal restoration using artificial neural networks. IEEE Transactions on Biomedical Engineering, Vol. 43, No. 4, April 1996, pp. 357-372.
  • [185] Materka A., Telfer M. Model identification for time-invariant nonlinear systems with delay using feedforward neural networks. Proc. 2nd Int. Conf. Modeling Simulation, Vol. 1, Melbourne, Australia 1993, pp. 125-131.
  • [186] MaterkaA. [red.]. Elementy cyfrowego przetwarzania i analizy obrazów. Państwowe Wydawnictwo Naukowe, Warszawa-Łódź 1991.
  • [187] Matthaei E. M. T., Young G.L., Jones L. Microwave filters, impedancematching networks and coupling structures. Artech House, 1980.
  • [188] McIntyre M.E., Schumacher R. T., Woodhouse J. On the oscillations of musical instruments. J. Acoust. Soc. Am., Vol. 74, No. 5, November 1983.
  • [189] McLaughlin S., Lowry A. Nonlinear dynamical systems concepts in speech analysis. Proceedings of EUROSPEECH’93, 1993, pp. 377-380.
  • [190] Mendel J. M., Habibi-Ashrafi F. Survey of Approaches to Solving Inverse Problems for Lossless Layered Media Systems. IEEE Trans. Geosci. Electron., GE-18, 1980, pp. 320-330.
  • [191] Mermelstein P. Determination of the Vocal-Tract Shape from Measured Formant Frequencies. Journal of Acoustic Society of America, Vol. 41:pp. 1283-1294, May 1967.
  • [192] Meshanov V. P., Rasukova LA., Tupikin V. D. Stepped transformers on TEM-transmission lines. IEEE Transactions on Microwave Theory and Techniques, Vol. 44, No. 6, June 1996, pp. 793-798.
  • [193] Mian G. A., Riccardi G. A localization property of line spectrum frequencies. IEEE Transactions on Speech and Audio Processing, Vol. 2, No. 4, October 1994, pp. 536-539.
  • [194] Milenko VIC P. Glottal inverse filtering by joint estimation of an AR system with a linear output model. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 1, February 1986, pp. 28-42.
  • [195] Monden Y., Arimoto S. Generalized Rouche's Theorem and its application to multivariate autoregressions. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No. 6, December 1980, pp. 733-738.
  • [196] Morawski T., Gwarek W. Pola i fale elektromagnetyczne. Wydawnictwo Naukowo-Techniczne, Warszawa 1998.
  • [197] Morf M., Dickinson В., Kailath T., Vieira A. Efficient solution of covariance equations for linear prediction. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-25, No. 5, October 1977, pp. 429-433.
  • [198] Moses R. L., Beex A. A. (Louis). A comparison of numerator estimators for ARMA spectra. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 6, December 1986, pp. 1668-1671.
  • [199] Murthi M. N., Rao B. D. All-pole modeling of speech based on the minimum variance distortionless response spectrum. IEEE Transactions on Speech and Audio Processing, Vol. 8, No. 3, May 2000, pp. 221-239.
  • [200] Nackaerts A., Moor B.De, Lauwereins R. A formant filtered physical model for wind instruments. IEEE Transactions on Speech and Audio Processing, Vol. 11, No. 1, January 2003, pp. 36-44.
  • [201] Nahman N. S. Picosecond-domain waveform measurement: Status and future directions. IEEE Trans. Instrum. Meas., Vol. IM-32, No. 9, March 1983, pp. 117-124.
  • [202] Narayanan S. S., Alwan A. A. A nonlinear dynamical system analysis of frictative consonants. J. Acoust. Soc. Am., Vol. 97, April 1995, pp. 2511-2524.
  • [203] Nederveen C. J. Acoustical Aspects of Woodwind Instruments. Frits Knuf, Amsterdam 1969.
  • [204] Olive J. P., Greenwood A., Coleman J. Acoustics of American English Speech. Springer, New York 1993.
  • [205] Oppenheim A.V., Schafer R. W. Cyfrowe przetwarzanie sygnałów. Wydawnictwo Komunikacji i Łączności 1979, Warszawa.
  • [206] Oppenheim A. V., Schafer R. W., Buck J. R. Discrete-Time Signal Processing. Prentice Hall International, London 1999.
  • [207] Orfanidis S. J. Optimum Signal Processing: An Introduction. McGraw-Hill Publishing Company, New York 1988.
  • [208] Osiowski J. Zarys rachunku operatorowego. Wydawnictwo Naukowo-Techniczne, Warszawa 1981.
  • [209] Ostaszewska D., Tambor J. Podstawowe wiadomości z fonetyki i fonologii współczesnego języka polskiego. Skrypt Uniwersytetu Śląskiego nr 488, Katowice 1993.
  • [210] Paksoy E., Viswanathan V., McCree A. Speech Coding Standards in Mobile Communications. W A.Gatherer, E.Auslander, [red.]. The Application of Programmable DSPs in Mobile Communications. John Wiley & Sons, New York 2002, pp. 137-157.
  • [211] Paliwal K. K., Atal B. S. Efficient vector quantization of LPC parameters at 24 bit/frames. IEEE Transactions on Speech and Audio Processing, Vol. 1, No. 1, January 1993, pp. 3-14.
  • [212] Pan T-W., Hsue C-W., Huang J.-F. Time domain reflectometry using arbitrary incident waveforms. IEEE Transactions on Microwave Theory and Techniques, Vol. 50, No. 11, November 2002, j>p.2558-2563.
  • [213] Papoulis A. Probability, Random Variables, and Stochastic Processes. McGraw-Hill Inc., New York 1984.
  • [214] Papoulis A., Pillai S.U. Probability, Random Variables, and Stochastic Processes. McGraw-Hill Inc., New York 2002.
  • [215] Perkell J. S. et al. electromagnetic midsagittal articulometer systems for transducting speech articulatory movements. J. Acoust. Soc. Am., Vol. 92, No. 6, 1992, pp. 3078-3096.
  • [216] PlCONE J. et al. signal modeling techniques in speech recognition. Proceedings of IEEE, Vol. 81, No. 9, September 1993, pp. 1215-1247.
  • [217] Pillai S. U., Shim T. I. Spectrum Estimation and System Identification. Springer-Verlag, New York-Berlin 1993.
  • [218] Pillai S. U., Shim T. L, Benteftifa M. H. A new spectrum extension method that maximizes the multistep minimum prediction error - generalization of the maximum entropy concept. IEEE Transactions on Signal Processing, Vol. 40, No. 1, January 1992, pp. 142-158.
  • [219] Pillai S. U., Shim T. I., Youla D. C. Anew technique for ARMA-system identyfication and rational approximation. IEEE Transactions on Signal Processing, Vol.SP-41, No.3, March 1993, pp. 1281-1304.
  • [220] Pimbley J. M. Recursive maximum likelihood estimation of complex autoregressive processes. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 8, August 1990, pp. 1466-1467.
  • [221] Press W. Н., Teukolsky S.A., Vetterling W. T., Flannery B.P. Numerical Recipes in C. Cambridge University Press, Cambridge, New York, Port Chester, Melbourne, Sydney 1997.
  • [222] Priestley M. B. Spectral Analysis and Time Series. Academic Press, New York 1981.
  • [223] Proakis J. G. Digital Communications. McGraw-Hill Inc., Boston - New York 2001, fourth edition.
  • [224] Rabiner L., Juang B.-H. Fundamentals of Speech Recognition. Prentice Hall, Englewood Cliffs 1993.
  • [225] Rabiner L.R., Schafer R. W. Digital Processing of Speech Signals. Prentice Hall Inc., Upper Saddle River, New Jersey 1978.
  • [226] Rahim M. G., Goodyear C. C., Klein W. В., Schroeter J., Sondhi M. M. On the use of neural networks in articulatory speech synthesis. J. Acoust. Soc. Am., Vol. 93, No. 2, 1993, pp. 1109-1121.
  • [227] Ramachandran R. P., Sondhi M. M., Atal B. S. A two codebook format for robust quantization of line spectral frequencies. IEEE Transactions on Speech and Audio Processing, Vol. 3, No. 3, May 1995, pp. 157-168.
  • [228] Recknagel, Sprenger, Hönmann, Schramek. Poradnik ogrzewanie i klimatyzacja z uwzględnieniem chłodnictwa i zaopatrzenia w ciepłą wodę. EWFE, Gdańsk 1994.
  • [229] Rhodez J. D. Theory of Electrical Filters. John Wiley & Sons Inc., New York 1976.
  • [230] Rix A. W., Beerends J. G., Hollier M. P., ,Hekstra A. P. Perceptual evaluation of speech quality (PESEQ) - a new method for speech quality assessment of telephone networks and codecs. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2001, pp. 749-752.
  • [231] Roberts R. R., Town G. E. Design of microwave filters by inverse scaterring. IEEE Transactions on Microwave Theory and Techniques, Vol. 43, No. 4, April 1995, pp. 739-743.
  • [232] Robinson E. A. A historical perspective of spectrum estimation. Proceedings of IEEE, Vol. 70, 1982, pp. 885-907.
  • [233] Robinson E. A., Treitel S. Digital signal processing in geophysics. A. Oppenheim, [red.]. Applications of Digital Signal Processing. Englewood Cliffs, NJ: Prentice-Hall 1978.
  • [234] Rosłoniec S. Liniowe obwody mikrofalowe. Wydawnictwo Komunikacji i Łączności, Warszawa 1999.
  • [235] Rothweiler J. On polynomial reduction in the computation of LSP frequencies. IEEE Transactions on Speech and Audio Processing, Vol. 7, No. 5, September 1999, pp. 592-594.
  • [236] Roux J. Le, Grenier Y. An iterative procedure for moving average models estimation. Proceedings of IEEE ICASSP, 1980, pp. 614-617.
  • [237] Salami R., Laflamme C., Bessette B., Adoul J.-P. ITU-T G.729 Annex A: Reduced Complexity 8 kb/s CS-ACELP Codec for Digital Simultaneous Voice and Data. IEEE Communications Magazine, Vol. 35, pp. 56-63, 1997.
  • [238] Salami R., Laflamme C., Bessette B., Adoul J.-P. ITU-T G.729 Annex A: Reduced complexity 8 kb/s CS-ACELP codec for digital simultaneous voice and data. IEEE Communications Magazine, Vol. 35, No. 9, September 1997, pp. 56-63.
  • [239] Sarkar T.K., Schwarzlander H., Choi S., Palma M.S., Wicks M. C. Stochastic versus deterministic models in the analysis of communication systems. IEEE Antenna’s and Propagation Magazine, Vol. 44, No. 4, August 2002, pp. 40-50.
  • [240] Schröder G., Sherif M.H. The road to G.729: ITU 8-kb/s speech coding algorithm with wireline quality. IEEE Communications Magazine, Vol. 35, No. 9, September 1997, pp. 48-54.
  • [241] Schroeter J., Larar J. N., Parthasarathy S. Vocal-tract areas versus articulatory parameters in speech production modeling. J. Acoust. Soc. Am., Vol. 84, suppl. 1, SI27.
  • [242] Schroeter J., Larar J. N., Parthasarathy S. Speech parameter estimation using a vocal tract/cord model. Proceedings of IEEE ICASSP, Vol. 1,1987, pp. 308-311.
  • [243] Schroeter J., Sondhi M. M. Dynamic programming search of articulary codebooks. Proceedings of IEEE ICASSP, Vol. 1, 1989, pp. 588-591.
  • [244] Schroeter J., Sondhi M. M. Techniques for estimating vocal-tract shapes from the speech signal. IEEE Trans, on Speech and Audio Processing, Vol. 2, No. 1, Partii, January 1994, pp. 133-150.
  • [245] Shankowitz C. R., Georgiou T. T. The envelope of spectral power for stochastic processes. IEEE Transactions on Information Theory, Vol. 40, No. 2, March 1994, pp. 584-588.
  • [246] Shankowitz C.R., Georgiou T. T. On the maximum entropy method for interval covariance sequences. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 10, October 1990, pp. 1815-1817.
  • [247] Shannon C. E. Communication in the Presence of Noise. Proceedings of IRE, Vol. 37, January 1949, pp. 10-21.
  • [248] Shannon C. E. A Mathematical Theory of Communication. Bell System Technical Journal, Vol. 27, October 1948, pp. 623-656.
  • [249] Shirai K., Kobayashi T. Estimation of articulatory motion using neural networks. J. Phonetics, Vol. 19, 1991, pp. 379-385.
  • [250] Sieńko W., Сітко W. M., Wilamowski B.M. Hamiltonian neural nets as a universal signal processor. Proc, of IEEE 2002 28th Annual Conference of the Industrial Electronics Society, Vol. 4, 2002, pp. 3201-3204.
  • [251] Smith J. О..ІП. Physical modeling using digital waveguides. Comput. Music J., Vol. 16, No. 4, 1992, pp. 74-91.
  • [252] Söderström T., Stoica P. Identyfikacja systemów. Państwowe Wydawnictwo Naukowe, Warszawa 1997.
  • [253] Sondhi M. M., Gopinath В. Determination of vocal tract from impulse response at the lips. J. Acoust. Soc. Am., Vol. 49, No. 6, pt. 2, 1971, pp. 1867-1873.
  • [254] Sondhi M. M., Resnick J. R. The inverse problem for the vocal tract: numerical methods, acoustical experiments and speech synthesis. J. Acoust. Soc. Am., Vol. 73, No.3, 1983, pp. 985-1002.
  • [255] Soong F.K., Juang B.-H. Optimal quantization of LSP parameters. IEEE Transactions on Speech and Audio Processing, Vol. 1, No. 1., January 1993, pp. 15-24.
  • [256] Soong F. K., Juang B-H. Line spectrum pair (LSP) and speech data compression. In Proceedings of ICASSP, San Diego 1984, pp. 1.10.1-1.10.4.
  • [257] European Technical Standard. ETS 300 961 Digital cellular telecommunications system; Full rate speech; Transcoding, (GSM 06.10 version 5.0.0). CEPT, December 1996.
  • [258] Stark H., Woods J. W. Probability and Random Processes with Applications to Signal Processing. Prentice Hall, Upper Saddle River, New Jersey 2002.
  • [259] Steffen-Batogowa M. Automatyzacja transkrypcji fonematycznej tekstów polskich. Państwowe Wydawnictwo Naukowe, Warszawa 1975.
  • [260] Stoica P., Moses R. Introduction to Spectral Analysis. Prentice-Hall Inc., Englewood Cliffs, NJ 1997.
  • [261] Stone M. A three-dimensional model of tonque movement based on ultrasound and X-ray microbeam data. J. Acoust. Soc. Am., Vol. 87, No. 5,1990, pp. 2207-2217.
  • [262] Strauss W. Digital signal processing, the new semiconductor industry technology driver. IEEE Signal Processing Magazine, Vol. 17, No. 2:pp. 52-56, March 2000.
  • [263] Subramaniam A.D., Rao B. D. PDF optimized parametric vector quantization of speech line spectral frequencies. IEEE Transactions on Speech and Audio Processing, Vol. 11, No. 2, March 2003, pp. 130-142.
  • [264] Tadeusiewicz R. Problemy biocybernetyki. Państwowe Wydawnictwo Naukowe, Warszawa 1994.
  • [265] Tadeusiewicz R. Sieci neuronowe. Akademicka Oficyna Wydawnicza RM, Warszawa 1993.
  • [266] TADEUSIEWICZ R. Sygnał mowy. Wydawnictwo Komunikacji i Łączności, Warszawa 1988.
  • [267] Tadeusiewicz R. W stronę uśmiechniętych maszyn: spacer pograniczem biologii i techniki. „Alfa”, Warszawa 1989.
  • [268] Tadeusiewicz R., Izworski A. Metody komputerowej ekstrakcji parametrów dystynktywnych z ciągłego sygnału mowy polskiej. Archiwum Akustyki, Vol. 8, No.3, 1983, pp. 253-274.
  • [269] Tadeusiewicz R., Wszołek W., Izworski A., Wszołek T. The methods of pathological speech visualization using Kohonen neural networks. Proceedings of the First Joint BMES/EMBS Conference, Vol. 2, October 1992, pp. 980-981.
  • [270] Temes G.C., Mitra S.K. [red.]. Teoria i projektowanie filtrów. Wydawnictwo Naukowo-Techniczne, 1978.
  • [271] Therrien Ch. W. The Lee-Wiener Legacy. IEEE Signal Processing Magazine, Vol. 19, November 2002, pp. 33-44.
  • [272] Thomson M.M., Guillemin B.J. Design and performance of an algorithm for estimating vocal tract parameters. IEEE Transactions on Speech and Audio Processing, Vol. 2, No. 4, October 1994, pp. 531-536.
  • [273] Tierney J. A study of LPC analysis of speech in additive noise. IEEE Transactions on Acoustics, Speech an J Signal Processing, Vol. ASSP-28, No. 4, August 1980, pp. 389-397.
  • [274] Tokuda I., Tokunaga R., Aihara K. A simple geometrical structure underlying speech signals of the Japanise vowel /а/. Int. J. Bifurc. Chaos, Vol. 6, 1996, pp. 149-160.
  • [275] Tuller M., Shao S., Kelso J. A. S. An evaluation of an alternating magnetic field device for monitoring tonque movements. J. Acoust. Soc. Am., Vol. 88, No. 2, 1990, pp. 674-679.
  • [276] Verhelst W., Steenhaut O. A new model for the short-time complex cepstrum of voiced speech. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-34, No. 1, February 1986, pp. 43-51.
  • [277] Viswanathan R., Makhoul J. Quantization properties of transmission parameters in linear predictive systems. IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-23, No. 3, June 1975, pp. 309-321.
  • [278] VORAN S. Objective estimation of perceived speech quality – Part I: Development of the measuring normalizing block technique. IEEE Transactions on Speech and Audio Processing, Vol. 7, No. 4, July 1999, pp. 371-382.
  • [279] Voran S. Objective estimation of perceived speech quality – Part II: Evaluation of the measuring normalizing block technique. IEEE Transactions on Speech and Audio Processing, Vol. 7, No. 4, July 1999, pp. 383-390.
  • [280] Waele S.de, Broersen P.M. T. The Burg algorithm for segments. IEEE Transactions on Signal Processing, Vol. 48, No. 10, October 2000, pp. 2876-2880.
  • [281] Wakita H. Direct Estimation of the Vocal Tract Shape by Inverse Filtering of Waveforms. IEEE Transactions on Audio Electroacoustic, Vol. AU-21 :pp. 417-427, October 1973.
  • [282] Wang S., Gersho A. Phonetically-based vector excitation coding of speech at 3.6kbps. Proceedings of IEEE ICASSP, 1989, pp. 49-52.
  • [283] Wang Y., Krishna H., Krishna B. Split Levinson algorithm is weakly stable. ICASSP-89, 1989 International Conference on Acoustics, Speech, and Signal Processing, Vol.2, 23-26 May 1989, pp. 1215-1218.
  • [284] Ware J. A., Aki K. Continuous and discrete inverse scattering problems in a stratified elastic medium. I. Plane waves at normal incidence. J.Acoust. Soc. Am., Vol. 45, 91, 1969.
  • [285] Wei B., Gibson J. D. Anew discrete spectral modeling method and an application to CELP coding. IEEE Signal Processing Letters, Vol. 10, No. 4, April 2003, pp. 101-103.
  • [286] Wei B., Gibson J. D. Comparision of distance measures in discrete spectral modeling. Proceedings of the IEEE Digital Signal Procesing Workshop, Hunt, TX, October 2000.
  • [287] Welling L., Ney H., Kanthak S. Speaker adaptive modeling by vocal tract normalization. IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 6, September 2002, pp. 415-426.
  • [288] Wohlers M. R. A realizability theory for smooth lossless transmission lines. IEEE Transactions on Circuit Theory, Vol. CT-13, No. 4, December 1966, pp. 356-363.
  • [289] Wood L.C., Treitel S. Seismic signal processing. Proceedings of the IEEE, Vol. 63(4), 1, April 1975, pp. 649-66.
  • [290] Wróblewski A.K., Zakrzewski J.A. Wstęp do fizyki, toml. Państwowe Wydawnictwo Naukowe, Warszawa 1976.
  • [291] Wszołek W., Tadeusiewicz R., Izworski A., Wszołek T. Automated understanding of selected voice tract pathologies based on the speech signal analysis. Proc. 23rd Ann. Inter. Conf, of the IEEE Engineering in Medicine and Biology Society, Vol. 2, 2001, pp. 4132-4136.
  • [292] Wu С.-H., Chen J.-H. A novel two-level method for the computation of the LSP frequencies using a decimation-in-degree algorithm. IEEE Transactions on Speech and Audio Processing, Vol. 5, No. 2, March 1997, pp. 106-115.
  • [293] Wu С.-H., Yagle A. E. Numerical performances of autoregressive spectrum estimators based on three-term recurrences. IEEE Transactions on Signal Processing, Vol. 40, No. 1, January 1992, pp. 249-252.
  • [294] Xiao G., Yashiro K., Guan N., Ohkawa S. A new numerical method for synthesis of arbitrarily terminated lossless nonuniform transmission lines. IEEE Transactions on Microwave Theory and Techniques, Vol. 49, No. 2, February 2001, pp. 369-376.
  • [295] Yagle S., Robinson E. A. Maximum entropy spectral decomposition of a seismogram into its minimum entropy component plus noise. Geophysics, 46, p. 1108, 1981.
  • [296] Youla D.C., Kazanjian N.N. Bauer-type factoryzation of positive matrices and the theory of matrix polynomials orthogonal on the unit circle. IEEE Transactions on Circuits and Systems, Vol. CAS-25, February 1978, pp. 57-69.
  • [297] Zalewski K. Wykłady z termodynamiki fenomenologicznej i statystycznej. Państwowe Wydawnictwo Naukowe, Warszawa 1969.
  • [298] Zarowski C. J., Card H. C. Finite precision arithmetic and the Schur algorithm. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 8, August 1990, pp. 1475-1478.
  • [299] Zarzycki J. Cyfrowa filtracja ortogonalna sygnałów cyfrowych. Wydawnictwo Naukowo-Techniczne, Warszawa 1998.
  • [300] Zhang H.-М., Duhamel P.'Tressens S. An improved Burg-type recursive lattice method for autoregressive spectral analysis. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 8, August 1990, pp. 1437-1445.
  • [301] Zieliński P. Fizyczne podstawy muzyki. Piękno ukryte w liczbach. Foton, styczeń-luty 1997, ss. 7-17.
  • [302] Zieliński T. P. Od teorii do cyfrowego przetwarzania sygnałów. Wydział Eletro-techniki, Automatyki, Informatyki i Elektroniki AGH, Kraków 2002.
  • [303] Zieliński T. P. Joint time-frequency resolution of signal analysis using Gabor transform. IEEE Transactions on Instrumentation and Measurement, Vol. 50, No. 5, October 2001, pp. 1436-1444.
  • [304] ZIÓŁKO M. Komputerowe modelowanie liniowych systemów hiperbolicznych. Zeszyty Naukowe Akademii Górniczo-Hutniczej, nr 1322, Automatyka, z. 52. Kraków 1989.
  • [305] Ziółko M. Modelowanie zjawisk falowych. AGH, Uczelniane Wydawnictwo Naukowo-Dydaktyczne, Kraków 2000.
  • [306] Ziółko M. Finite dimensional approximations of distributed parameter electric lines. Proc. IEEE Int. Symp. on Circuits and Systems ISCAS-93, Vol. 4, May 1993, pp. 2291-2294.
  • [307] Zilovic M.S., Ramachandran R. P., Mammone R. J. Speaker identification based on the use of robust cepstral features obtained from pole-zero transfer functions. IEEE Transactions on Speech and Audio Processing, Vol. 6, No. 3, May 1998, pp. 260-267.
  • [308] http://www.ieee.org/theinstitute
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSL9-0005-0014
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.