Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Logatom intelligibility asquality measure of MP3 encoded speech
Konferencja
Krajowa Konferencja Radiokomunikacji, Radiofonii i Telewizji (21-23.06.2017 ; Poznań, Polska)
Języki publikacji
Abstrakty
W wielu systemach telekomunikacyjnych realizujących przekaz mowy na odległość istotnym czynnikiem jest jakość mowy. Wpływa na nią wiele czynników, w tym zastosowana technika kodowania. Spośród wielu standardów kodowania, w niniejszym artykule skupiono się na technice MP3. W zależności od użytej szybkości bitowej uzyskuje się lepszą lub gorszą jakość mowy. Jedną z metod pozwalających na ocenę jakości mowy w oparciu o kryterium zrozumiałości jest pomiar wyrazistości logatomowej.Celem badań było określenie jak ustalenie minimalnej szybkości bitowej dla której uzyskuje się zadowalającą zrozumiałość mowy. W efekcie wykonanych badań ustalono minimalną szybkość bitową, od której uzyskuje się satysfakcjonujące rezultaty.
The speech quality is an important factor in the speech transmission telecommunication systems. It is under influence of many factors, such as: telecommunication channel suppression, noises, delays, etc. and finally the applied encoding technique. In this paper the attention was payed to one particular technique: MP3. Depending on the bit rate score used, different quality and intelligibility is obtained. One of the techniques allowing the validation of speech quality on the basis of intelligibility criterion is the logatom intelligibility measure. The aim of the tests was to settle the minimal bit rate score which can ensure satisfactory speech intelligibility. As a result of the carried out experiments the minimal value of bit rate score from which satisfactory results are obtained was settled out.
Wydawca
Rocznik
Tom
Strony
332--335, CD
Opis fizyczny
Bibliogr. 22 poz., rys.
Twórcy
autor
- Politechnika Wrocławska, Wydział Elektroniki, Katedra Akustyki i Multimediów, Wybrzeże Wyspiańskiego 23, 50-370 Wroclaw
Bibliografia
- [1] Brachmański Stefan, 2012, „Automation of subjective measurements of logatom intelligibility in classrooms”, Automation, ed. by Florian Kongoli, InTech www.intechopen.com.
- [2] Brachmański Stefan, 2008, „Automation of subjective measurements of speech intelligibility in analogue telecommunication channels”, Archives of Acoustics, 33 (3), 341 - 350.
- [3] Brachmański Stefan, 2016, „Ocena jakości mowy kodowanej w standardzie MP3 i AAC”. w: „Współczesne zagadnienia techniki fonicznej, wizyjnej i medycznej” red. Dobrucki Andrzej, Kin Maurycy, Leniowska Lucyna, Rzeszów – Wrocław, 13 – 25.
- [4] Brachmański Stefan, 2014, “Subjective assessment of quality of audio and video signals by means of AB test”, Signal evaluation and monitoring in sound engineering, ed. by Andrzej Dobrucki, Audio Engineering Soc.-Polish Section, Wrocław, 19 - 37.
- [5] Brachmański Stefan, 2007, “ Subjective assessment of quality of multimedia signals by means of A-B test”, 122nd Convention AES, Vienna,. Convention paper 7118.
- [6] Brachmański Stefan, 2016, „Wpływ szybkości bitowej na wyrazistość logatomową mowy kodowanej w formacie AAC”, w: „Postępy akustyki – Advances in Acoustics”, red. Meissner Mirosław, Polskie Towarzystwo Akustyczne, Warszawa, 183 - 194.
- [7] Brachmański Stefan, 2015, „Wybrane zagadnienia oceny jakości transmisji sygnału mowy”, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław.
- [8] Brandenburg, Karlheinz, 1999, "MP3 and AAC explained." Audio Engineering Society Conference: 17th International Conference: High-Quality Audio Coding. Audio Engineering Society.
- [9] Brandenburg Karlheinz, Dietz Martin, Eberlein Ernst, Bitto Roland 1993, "Extending MPEG-Audio layer III to wideband speech coding." Speech Coding for Telecommunications, Proceedings., IEEE Workshop on. IEEE, 7-8.
- [10] ISO/IEC, 1993, „Information Technology - Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s – Part 3: Audio”; Standard ISO/IEC 11172-3.
- [11] ITU-T Recom, P.800, 1996, „Method for subjective determination of transmission quality.
- [12] ITU-T Recom. P.863, 2011, „Methods for objective and subjective assessment of speech quality. perceptual objective listening quality assessment”.
- [13] Jacaba Joebert, 2001, “Audio compression using modified discrete cosine transform: The MP3 coding standard”, http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.106.2873&rep=rep1&type=pdf (dostęp 13.03.2017).
- [14] Li Z.N., Drew M.S., (2004), „Fundamentals of multimedia”, Pearsons Education Inc.
- [15] Majewski Wojciech, Myślecki Wojciech, Baściuk Kazimierz, Brachmański Stefan, 1998, „Application of modified logatom intelligibility test in telecommunications, audiometry and room acoustics”, Proc. 9th Mediterranean Electrotechnical Conf. Melecon’98, Tel-Aviv, Israel, 25-28.
- [16] Musmann H.G., 2006, „Genesis of the MP3 audio coding standard”, IEEE Transaction on Consumer Electronics, 52 (3), 1043 – 1049.
- [17] POLSKA NORMA PN-90 / T - 05100, 1990, „Analogowe łańcuchy telefoniczne. Wymagania i metody pomiaru wyrazistości logatomowej.”, Wyd. Normalizacyjne.
- [18] POLSKA NORMA PN – V - 90002, 1999, „Cyfrowe łańcuchy telefoniczne. Wymagania i metoda pomiaru wyrazistości logatomowej.”, Wyd. Normalizacyjne.
- [19] Pras Amandine, Zimmerman Rachel, Levitin Daniel, Guastavino Catherine, 2009, „Subjective evaluation of mp3 compression for different musical genres”, 127th Convention Audio Engineering Society. New York, Convention paper 7879
- [20] Raissi R., 2002, „The theory behind mp3”, www.mp3-tech.org/programmer/docs/mp3_theory.pdf (dostęp 13.03.2017)
- [21] Vercellesi Giancarlo, 2007, Vitali Andrea, Zerbini Martino, Multimedia and Expo, 2007 IEEE International Conference on. IEEE, 1279-1282
- [22] Zuska Mateusz, 2017, „Wpływ szybkości bitowej na jakość sygnału mowy kodowanego w formacie MP3”, Praca dyplomowa, Politechnika Wrocławska.
Uwagi
PL
Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę (zadania 2017)
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-80c0a5eb-e280-44fb-9c64-fa9659c18247