Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 14

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  psychoakustyka
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The aim of the study was to assess whether four psychoacoustic parameters (sharpness, roughness, fluctuation strength and tonality) are useful in describing the perceived annoyance of selected noise sources with respect to an objective assessment based on the acoustics standards. Second goal was to verify if the perceived annoyance of such noises correlates with dominant frequency in electroencephalography (EEG) frequency bands. Twenty sound sources, varying in the degree of nuisance, have been assessed by 178 respondents in an Internet-based psychoacoustic test. Obtained annoyance grades were correlated with calculated psychoacoustic and normative parameters and the positive correlation between perceived annoyance and three psychoacoustic parameters (sharpness, roughness and fluctuation strength) was found. In the second part EEG study during listening of recorded sounds was performed on 18 healthy volunteers. Spearman’s rank correlation confirmed that dominant frequencies in alpha (7-14 Hz) and beta2 band (20-30 Hz) were rising with the increasing annoyance of the sounds. Results obtained may be useful in specifying and clarifying permissible noise levels for annoying sounds.
PL
Celem prac było zbadanie czy psychoakustyczne parametry takie jak ostrość, szorstkość, siła fluktuacji, tonalność mogą być użyteczne do opisu uciążliwości wybranych źródeł hałasu, w odniesieniu do obiektywnej oceny opartej o akustyczne standardy. Drugim celem pracy było sprawdzenie, czy postrzegana uciążliwość tych dźwięków koreluje z częstotliwościami dominującymi w pasmach częstotliwości stosowanych w elektroencefalografii (EEG). W pierwszej części badań 178 osób wypełniło ankietę, oceniając uciążliwość prezentowanych dźwięków. Otrzymane oceny zostały skorelowane z wyliczonymi psychoakustycznymi i normatywnymi parametrami. Potwierdzono, że wraz ze wzrostem wartości parametrów takich jak ostrość, szorstkość i siła fluktuacji, wzrasta także postrzegana przez słuchaczy uciążliwość dźwięków. W drugiej części eksperymentu wykonano badania EEG 18 osób podczas odsłuchu powyższych 20 nagrań. Test korelacji rang Spearmana potwierdził, że dominujące częstotliwości w paśmie alfa (7-14Hz) i beta2 (20-30Hz) wzrastały wraz ze wzrostem średniej oceny uciążliwości. Wyniki przeprowadzonych badań mogą być przydatne do doprecyzowania parametrów oceny hałasu i ich dopuszczalnych wartości.
EN
A novel speech enhancement method based on generalized sidelobe canceller (GSC) structure is presented. We show that it is possible to reduce audible speech distortions and preserve residual noise level under acoustic model uncertainties. It can be done by constraining a speech leakage power according to masking phenomena and conditional minimizing the residual noise power. We implemented the proposed approach using a simple delay-and-sum beamformer model. Finally a comparative evaluation of the selected methods is performed using objective speech quality measures. The results show that the novel method outperforms conventional one providing lower speech distortions.
PL
Prezentowana jest nowa metoda uzdatniania mowy w oparciu o strukturę uogólnionego tłumika listków bocznych. Wykazujemy, ze możliwe jest zmniejszenie słyszalnych zniekształceń mowy przy zachowaniu stałego poziomu szumu rezydualnego, dla modeli przybliżonych środowiska akustycznego. Może to być dokonane poprzez uwarunkowanie poziomu mocy przecieku mowy zgodnie ze zjawiskiem maskowania oraz minimalizację warunkową mocy szumu rezydualnego. Proponowane podejście zaimplementowano w oparciu o prosty model beamformera opóźniająco-sumującego. Ostatecznie przeprowadzono ocenę porównawczą wybranych metod z wykorzystaniem obiektywnych miar jakości mowy. Wyniki pokazują, że nowa metoda przewyższa konwencjonalną zapewniając mniejsze zniekształcenia mowy.
PL
Przedstawiono połączony system kontroli echa akustycznego i zakłóceń środowiskowych w instalacjach glośnomówiących. Jest on zbudowany na nierównomiernym banku filtrów, który aproksymuje psychoakustyczną skalę Bark, dzięki zastosowanej transformacji dwuliniowej filtrami wszechprzepustowymi pierwszego rzędu. Zastosowano podpasmowy kompensator echa akustycznego w strukturze niezależnej od banku syntezy oraz algorytm tłumienia słyszalnych komponentów zakłóceń środowiskowych. Przedstawione w artykule rezultaty potwierdzają skuteczność prezentowanej konstrukcji w przypadku użycia jej jako systemu czołowego w instalacji głośnomówiącej, celem ogólnej poprawy słyszalności i zrozumiałości wypowiedzi, ze zdecydowaną redukcją szumów do poziomu tła akustycznego niezakłócającego mowy.
EN
This paper presents the integrated system to acoustic echo and noise reduction in order to improve the speech intelligibility in communication with used of hands-free devices. Processing in proposed combine system is based on nonuniform filter bank, witch approximate psychoacoustic properties of the human hearing system. The first order all-pass transformation is used to fit the nonuniform spread of the band to Bark scale. Synthesis independent subband acoustic echo canceller is used for acoustic echo control and audible noise suppression algorithm for noise reduction.
EN
Shortcomings of automatic speech recognition (ASR) applications are becoming more evident as they are more widely used in real life. The inherent non-stationarity associated with the timing of speech signals as well as the dynamical changes in the environment make the ensuing analysis and recognition extremely difficult. Researchers often turn to biology seeking clues to make better engineered systems, and ASR is no exception with the usage of feature sets such as Mel frequency cepstral coefficients, which employ filter banks similar to cochlear filter banks in frequency distribution and bandwidth. In this paper, we delve deeper into the mechanics of the human auditory system to take this biological inspiration to the next level. The main goal of this research is to investigate the computation potential of spike trains produced at the early stages of the auditory system for a simple acoustic classification task. First, various spike coding schemes from temporal to rate coding are explored, together with various spike-based encoders with various simplicity levels such as rank order coding and liquid state machine. Based on these findings, a biologically plausible system architecture is proposed for the recognition of phonetically simple acoustic signals which makes exclusive use of spikes for computation. The performance tests show superior performance on a noisy vowel data set when compared with a conventional ASR system.
PL
W pracy badane są właściwości podpasmowych odmian trzech znanych algorytmów filtracji adaptacyjnej: unormowanego algorytmu LMS, algorytmu rzutu afinicznego wstecz rzędu 2 (APA) oraz rekursywnego algorytmu najmniejszych kwadratów (RLS). Za ich postawę przyjęto spaczony modulowany kosinusowo bank filtrów, który dokonuje nierównomiernego podziału pasma, dostarczając rzeczywistych sygnałów kanałowych i dobrze aproksymując psychoakustyczną skalę Barków. System adaptacji o strukturze niezależnej od banku syntezy umożliwia poprawę zbieżności i obniżenie złożoności obliczeniowej filtracji adaptacyjnej w porównaniu z rozwiązaniami pełnopasmowymi lub wykorzystującymi banki modulowane DFT.
EN
This paper investigates the properties of subband variants of three adaptive filtering algorithms: Normalized Least Mean Squares, Recursive Least Squares and Affine Projection. A warped cosine-modulated filter bank, which partitions frequency nonuniformly, has been selected as their basis. The system, which produces realvalued channel signals and well approximates the psychoacoustic Bark scalę, make it possible to both improve convergence and decrease computational complexity of adaptive filtering compared with fullband solutions or those that use DFT filter banks.
EN
This paper is concerned with recently proposed perceptually constrained signal subspace (PCSS) method for speech enhancement. Two simplifications of the PCSS method are presented. The first approach is based on approximate diagonalization of the covariance matrix of noise energies in the transformed domain. The approximate solution is presented in a new form which provides perceptually optimal resi-dual noise shaping and does not require a whitening transformation. The second approach is a realization of the PCSS method in the frequency-domain. This is done using an assumption that the covariance matrices are circulant. The resulting estimator is almost identical to the well known IND (Inaudible Noise Distortion) rule. An evaluation of selected methods is performed using objective speech quality mea-sures and informal listening tests. The results show that the sub-optimal methods offer comparable speech quality as the exact solution in common situations.
PL
Artykuł dotyczy zaproponowanej ostatnio metody podprzestrzeni sygnału z ograniczeniami percepcyjnymi (PCSS). Prezentowane są dwa uproszczenia metody PCSS. Pierwsze podejście opiera się na przybliżonej diagonalizacji macierzy kowariancji energii szumu w dziedzinie transformaty. Rozwiązanie przybliżone umożliwia optymalne w sensie percepcyjnym kształtowanie widma szumu resztkowego i nie wymaga transformacji wybielających. Drugie podejście stanowi realizację metody PCSS w dziedzicznie częstotliwości. Osiąga się to wykorzystując założenie, że macierze kowariancji są macierzami okresowymi. Uzyskany estymator okazuje się niemal identyczny z dobrze znaną regułą IND. Przeprowadzana jest ocena wybranych metod przy użyciu obiektywnych miar jakościowych oraz nieformalnych testów odsłuchowych. Wyniki wskazują, że metody przybliżone oferują porównywalną jakość mowy do metody dokładnej w typowych warunkach.
PL
Przedmiotem prac prowadzonych przez autorów jest próba oceny zdolności człowieka do postrzegania i interpretowania przestrzennej sceny akustycznej, którą stanowi zespół dźwięków pochodzących ze zbioru źródeł rozmieszczonych w przestrzeni wokół słuchacza. Opisywany w niniejszym artykule etap badań skupia się przede wszystkim na zbudowaniu odpowiedniego zaplecza sprzętowego pozwalającego na wykonywanie eksperymentów akustycznych oraz poszukiwanie odpowiedzi na pytanie, czy człowiek jest zdolny rozróżniać lokalizacje wielu źródeł dźwięku równocześnie i jakie warunki muszą zachodzić, by taka przestrzenna percepcja była możliwa.
EN
Human ability to discern sounds coming from different locations is based on interaural differences and head-related filtration of acoustic signals. It allows to precisely localize a single sound source with high acuity. Our research focuses on more difficult task of perceiving and recognizing complex spatial sound patterns consisting of several acoustic signals emitted simultaneously from multiple sources. In this paper we describe our hardware platform used to perform such psychoacoustic experiments. We also discuss the results of some experiments performed to check what requirements must be met in order to make perception of spatial sound scene possible.
EN
This paper addresses the problem of noise reduction in speech communication devices. Firstly, basis of the spectral weighting techniques and related problems are presented. Next, we describe psychoacoustic principles as a tool improvement of speech enhancement systems. Conventional methods aimed at elemination of residual noise and their psychoacoustic modifications are discussed. The differences between them are amphasized. Finally, advantages of perceptual approaches over conventional ones are presented. Paper shows that exploitation of psychoacoustic models in speech enhancement provides significant improvements especially residual noise reduction and decrease of speech distortion.
PL
Przedstawiono problematykę związaną z projektowaniem oraz użytkowaniem systemów transmisji mowy opartych na metodzie wag widmowych. Omówiono rolę takich zjawisk psychoakustycznych jak maskowanie, pasma krytyczne i absolutny próg słyszenia w procesie uzdatniania sygnału mowy. Dokonano zestawienia klasycznych metod uzdatniania sygnału mowy ukierunkowanych na eliminację tonów muzycznych z systemami opartymi na psychoakustycznej modyfikacji metody wag widmowych. Porównano wyniki zastosowań rozwiązań psychoakustycznych pod kątem możliwości tłumienia szumu środowiskowego i zapobiegania generacji zniekształceń sygnału mowy. Uwypuklono korzyści wynikające z zastosowań podstawowych właściwości psychoakustycznych systemu słuchowego człowieka w metodach wag widmowych, jednocześnie wskazano ograniczenia tych metod i możliwości ich optymalizacji.
EN
This paper focuses on the class of speech enhancement systems, which capitalize on psychoacoustic properties of the human ear. More advanced psychoacoustically motivated spectral weighting rules are described. Presented systems are analyzed and classified according to their similarity with a human auditory model. Especially, a comparison of improvements in musical noise cancellation and increasing speech intelligibility is performed. Moreover, advantages of the perceptual approaches over conventional ones are focused. Finally, perspectives of integrated psychoacoustically motivated speech enhancement and coding systems are discussed. Paper shows that integration of subband coder with speech enhancement system based on non-uniformly spaced filter bank leads to most promissing combined scheme.
PL
Dokonano przeglądu oraz porównania metod uzdatniania sygnału mowy motywowanych perceptualnie. Wskazano na niedoskonałość rozwiązań psychoakustycznych wykorzystujących klasyczne metody wag widmowych. Opierając się na literaturze zaprezentowano różne sposoby psychoakustycznej optymalizacji tych metod. Prezentowane systemy sklasyfikowano według stopnia zgodności z modelem słuchowym człowieka. Jednocześnie zestawiono wyniki zastosowań rozwiązań psychoakustycznych pod kątem możliwości tłumienia szumu środowiskowego i zapobiegabia zniekształceń sygnału mowy. W zestawieniu uwzględniono także połączone systemy eliminacji echa i redukcji szumów. Ostatecznie przedstawiono perspektywy integracji systemu uzdatniania sygnału mowy z systemem kodowania podpasmowego uwydatniając wykorzystanie modeli psychoakustycznych jako element wspólny obu systemów.
EN
This document presents configuration of active network components dedicated to multimedia stream transport over networks. Author analyses network protocols responsible for carrying packets with multimedia data over wide area networks, in the way active network components perceives them. As most significant role in delivering data over WAN networks plays routers, author guides thru Cisco™ routers setup intended for multimedia transportation purpose. After setting-up routers, tests are being conducted in order to show differences between basic and multimedia-oriented configuration. Rejected or broken frames during communications are used for quality measure.
EN
This paper describes the measurements system of assessments of the quality of speech in rooms. It includes an overview of traditional method of subjective measurements of logatom intelligibility and modified intelligibility test with forced choice. Experiments in which the methods were used are described.
PL
Jedną z właściwości narządu słuchu człowieka jest zróżnicowanie odbieranych wrażeń akustycznych. Zróżnicowanie to występuje między innymi w zależności od wartości częstotliwości emitowanego dźwięku. Do ustalenia wartości najmniejszej spostrzegalnej różnicy częstotliwości może być wykorzystywana jedna z trzech istniejących już metod badawczych. Poniżej została zaproponowana pewna modyfikacja jednej z nich. Czy i na ile jest przydatna, można ocenić z otrzy­manych wyników badań skonfrontowanych z krzywymi literaturowymi. Badania weryfikacyjne zostały przeprowadzone dla osób w przedziale wiekowym 20-24 lat, w warunkach pola swobodnego. Praca zawiera także konkretne informacje dotyczące wartości tego progu różnicowego.
EN
One of the features of our hearing apparatus is a differentiation of the audible signals. The differentation exists among others in relationship with the sound frequency. One of three existing testing methods may be used to determine the lowest identifiable difference in frequency. Certain modification of one of these methods is presented below. Its usefulness may be ascertained by comparing the results with curves found in literature. Verifying test was conducted with persons in age from 20 to 24, in a free field condition. The paper contains the specific Information regarding value of differentiation threshold.
14
Content available remote Computer investigations of sound perception and noise annoyance
EN
The problem of influence of adverse sound environments on human psychophysical state and health has been outlined. Basic sound characteristics have been defined and the fundamental question of the relation between subjective and objective characteristics has been formulated. The general conception of a computer system for studying human perception of environmental sound and noise has been described. The usefulness of application of data mining algorithms in order to find practical rules that enable to determine subjective sound and noise parameters from the knowledge of physical ones has been pointed out.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.