Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 74

Liczba wyników na stronie
first rewind previous Strona / 4 next fast forward last
Wyniki wyszukiwania
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 4 next fast forward last
In recent years automatic classification employing machine learning seems to be in high demand for tele-informatic-based solutions. An example of such solutions are intelligent transportation systems (ITS), in which various factors are taken into account. The subject of the study presented is the impact of data pre-processing and normalization on the accuracy and training effectiveness of artificial neural networks in the case of pavement condition classification. First, audio parametrization process is shortly described and then the most commonly used methods of data normalization are recalled. Examples of analyses are shown, along with conclusions on application of neural networks to pavement moisture condition classification. A neural network based on the Java Neuroph library was designed. Training time and the network evaluation efficiency of the data without and with normalization performed were shown and analyzed. As it turns out, the Z-score normalization is the most accurate, and also the fastest one for the dataset gathered.
Automatyczna klasyfikacja wykorzystująca algorytmy uczenia maszynowego wymaga zastosowania rozwiązań teleinformatycznych. Przykładem takich rozwiązań są inteligentne systemy transportowe (ITS), w których brane są pod uwagę różne czynniki. Przedmiotem niniejszych badań jest wpływ wstępnego przetwarzania danych i normalizacji na dokładność i skuteczność treningu sztucznych sieci neuronowych w przypadku klasyfikacji stanu nawierzchni. W pierwszej kolejności krótko opisano proces parametryzacji sygnałów fonicznych, a następnie przywołano najczęściej używane metody normalizacji danych. Przedstawiono przykłady analiz wraz z wnioskami dotyczącymi zastosowania sieci neuronowych do klasyfikacji stanu nawierzchni. Zaprojektowano sieć neuronową w oparciu o bibliotekę Neuroph w języku Java. Zbadano czas treningu oraz skuteczność sieci dla danych bez obróbki, oraz stosując opisane metody normalizacji danych.
A research study presents investigations of the influence of the room acoustics on the frequency characteristic of the audio signal playback. First, a concept of a novel spectral equalization method of the room acoustic conditions is introduced. On the basis of the room spectral response, a system for room acoustics compensation based on an equalizer designed is proposed. The system settings depend on music genre recognized automatically. In order to acquire room acoustic characteristics, a series of measurements is performed. The impact of the impulse response on particular genres of music is also presented. In the analysis of impulse responses, examples of concert halls as well as other acoustic spaces are examined. Also, future experiments on sound playback correction are also outlined.
W artykule przedstawiono koncepcję automatycznego systemu korekcji z uwzględnieniem charakterystyki częstotliwościowej pomieszczenia oraz odtwarzanego gatunku muzycznego. Zaproponowany algorytm - na podstawie charakterystyki częstotliwościowej pomieszczenia - dokonuje kompensacji warunków akustycznych w otoczeniu emitera dźwięku. Dodatkowo, w procesie kompensacji uwzględniana jest zawartość sygnału, tj. gatunku muzycznego. Przedstawiono również wpływ odpowiedzi impulsowej na poszczególne gatunki muzyczne. Podczas analizy odpowiedzi impulsowych przebadano zarówno przykłady sal koncertowych, jak i miejsca codziennego użytku, np. klatka samochodowa czy samochód. Zarysowano również przyszłe prace związane z korekcją i jakością sygnału muzycznego w pomieszczeniach typowo dosłuchowych.
W pracy opisano zastosowanie aplikacji internetowej do oceny jakości dopasowania aparatów słuchowych. Metoda oceny polega na badaniu ankietowym, uzupełnionym testem rozumienia słów jednosylabowych w polu swobodnym. Opisywana aplikacja internetowa pozwala na przeprowadzenie badania z dowolnego komputera z dostępem do sieci. Dzięki implementacji metody w postaci aplikacji internetowej, można w systematyczny i uporządkowany sposób dokonywać oceny korzyści z użytkowania aparatów słuchowych. Daje też możliwość jej rozszerzenia czy modyfikacji. Z przeprowadzonych badań wynika, że ok. 60% użytkowników uzyskało w ciągu 7 dni zysk z aparatu słuchowego ≥10%, co oznacza efektywne zaopatrzenie. Największy zysk osiągają pacjenci z 2. i 3. stopniem niedosłuchu według skali WHO (World Health Organization).
The study presents application of the web-based application for the assessment of quality of hearing aid fitting. The method consists of a survey supplemented with the test for recognizing the single syllable words under free-field conditions. A web-based application has been developed to allow testing from any computer with the Internet access. The implementation of the method in the form of a web-based application, allows a systematic and organized assessment of the benefits gained from the hearing aid use. The application is an easy-to-use tool that can easily be modified. On the basis of the study performed, it may be observed that in the case of 60% of subjects it was possible to achieve benefit ≥10%, which signifies an effective fitting of the hearing aid. The highest benefit occurs for subjects with grade 2 and 3 of hearing loss according to the WHO scale.
Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w obecności sygnałów zakłócających, tj. szumu różowego oraz tzw. gwaru (ang. babble speech), określanego też jako efekt „cocktail-party”. W ramach badań przetwarzano próbki mowy głosów męskich. W pracy wykazano, że podniesienie częstotliwości podstawowej skutkuje zwiększonymi wartościami wskaźnika jakości mowy, mierzonymi przy użyciu standardu PESQ (Perceptual Evaluation of Speech Quality).
The aim of the work is to modify the speech signal in order to improve objective speech quality indicators after mixing the useful signal with noise or with an interfering signal. Modifications made to the signal are based on the characteristics of the Lombard speech, and in particular on the effect of raising the fundamental frequency F0. The recording session included sets of words and sentences in Polish, recorded in silence, as well as in the presence of interfering signals, i.e. pink noise and so-called babble speech, also referred to as the "cocktail-party" effect. As a part of the research, speech samples were processed - both sentences and words spoken by men. The study shows that raising the fundamental frequency results in increased values of the speech quality index, measured using the PESQ (Perceptual Evaluation of Speech Quality) standard.
W artykule przedstawiono najważniejsze składniki procesu skutecznego renderowania trójwymiarowego obrazu dźwiękowego za pomocą słuchawek. W tym celu badany jest stopień oddziaływania poszczególnych czynników wpływających na eksternalizację dźwięku: śledzenie położenia głowy (ang. head tracking), indywidualne funkcje przenoszenia głowy (HRTF – Head Related Transfer Function, odnoszące się do matematycznej funkcji propagacji dźwięku wokół głowy), model pomieszczenia, jak również tzw. efekt zgodności pomieszczenia oraz indywidualne wyrównywanie charakterystyki przenoszenia słuchawek. Uzyskane wyniki wskazują, że śledzenie głowy, a także indywidualne funkcje przenoszenia głowy mają kluczowe znaczenie dla wiernej reprodukcji dźwięku. Z przeprowadzonych badań wynika również, że efekt zgodności pomieszczenia i wyrównywanie charakterystyki przenoszenia słuchawek są znaczącymi elementami procesu auralizacji.
The article presents the most important components of the process of effectively rendering a three-dimensional sound image using headphones. To this end, the impact of a set of factors affecting sound externalisation is examined: head tracking, individual head transfer functions (HRTF – Head Related Transfer Function, related to the mathematical function of sound propagation around the head), room model, as well as a so-called room divergence effect and individual headphone alignment. Furthermore, the directivity aspect of the sound source is discussed as a convenient way to control Direct-toReverberant ratio and thus provides a robust control of the auditory distance. The results obtained indicate that the tracking of the head position as well as the individual functions of the head transfer are crucial for faithful sound reproduction. The conducted research also shows that the effect of room compliance and headphone alignment prove to be significant factors throughout the auralisation process.
The paper shows a study on the relationship between noise measures and sound quality (SQ) features that are related to annoyance caused by the traffic noise. First, a methodology to perform analyses related to the traffic noise annoyance is described including references to parameters of the assessment of road noise sources. Next, the measurement setup, location and results are presented along with the derived sound quality features. Then, statistical analyses are performed to compare the measurement results and sound quality features. The included conclusions are focused on showing that the obtained loudness values, regardless of the used system, are similar in a statistical sense. Contrarily, sharpness, roughness and fluctuation strength values differ for the tools employed.
The paper presents a comparative study of music features derived from audio recordings, i.e. the same music pieces but representing different music genres, excerpts performed by different musicians, and songs performed by a musician, whose style evolved over time. Firstly, the origin and the background of the division of music genres were shortly presented. Then, several objective parameters of an audio signal were recalled that have an easy interpretation in the context of perceptual relevance. Within the study parameter values were extracted from music excerpts, gathered and compared to determine to what extent they are similar within the songs of the same performer or samples representing the same piece.
W pracy przedstawiono charakterystykę systemu do wspomagania komunikacji w procesie neurorehabilitacji osób w stanie ograniczonej świadomości. Przygotowana aplikacja komputerowa wykorzystuje metodę śledzenia wzroku wspomaganą analizą sygnału EEG. W pracy podano genezę powstania systemu, scharakteryzowano zaimplementowane ćwiczenia oraz pozostałe funkcjonalności, a także zamieszczono wyniki wstępnych badań dokonanych w kilku polskich ośrodkach terapeutycznych.
The paper presents the characteristics of a system dedicated to communication support in the process of neurorehabilitation of persons in a state of limited consciousness. The prepared computer application uses eye tracking method supported by the EEG signal analysis. The paper presents the origin of the system, the implemented exercises and other system functionalities, as well as the results of the preliminary research carried out in several therapeutic centers.
The paper presents an intelligent equalizer solution based on room acoustic conditions and music genre analysis. A series of acoustic characteristic measurements are performed for checking the concept proposed. White noise (reference signal) and audio excerpts belonging to six music genres are utilized as excitation signals in measurements. This results in registration of frequency responses of rooms and reverberation times. Signals recorded in the listener’s receiver position are used to obtain room equalization characteristics. Pilot subjective tests are performed to obtain information on listeners’ preference on spectral characteristics of reproduced music depending on music genre.
W artykule przedstawiono koncepcję inteligentnego rozwiązania korektora graficznego uwzględniającego warunki akustyczne pomieszczenia oraz gatunek muzyczny. W przeprowadzonych pomiarach właściwości akustycznych badanych pomieszczeń wykorzystano szum biały (sygnał odniesienia) oraz fragmenty sygnałów fonicznych, należących do sześciu gatunków muzycznych. Na podstawie pomierzonej charakterystyki częstotliwościowej pomieszczenia dokonano kompensacji warunków akustycznych w otoczeniu miejsca odsłuchu z uwzględnieniem gatunku muzycznego. Przeprowadzono wstępne testy subiektywne w celu uzyskania informacji w kontekście preferencji słuchaczy reprodukowanej muzyki w zależności od gatunku muzycznego.
A voiceless stop consonant phoneme modelling and synthesis framework based on a phoneme modeling in low-frequency range and high-frequency range separately is proposed. The phoneme signal is decomposed into the sums of simpler basic components and described as the output of a linear multiple-input and single-output (MISO) system. The impulse response of each channel is a third order quasi-polynomial. Using this framework, the limit between the frequency ranges is determined. A new limit point searching three-step algorithm is given in this paper. Within this framework, the input of the low-frequency component is equal to one, and the impulse response generates the whole component. The high-frequency component appears when the system is excited by semi-periodic impulses. The filter impulse response of this component model is single period and decays after three periods. Application of the proposed modelling framework for the voiceless stop consonant phoneme has shown that the quality of the model is sufficiently good.
Content available Sound Intensity Distribution Around Organ Pipe
The aim of the paper was to compare acoustic field around the open and stopped organ pipes. The wooden organ pipe was located in the anechoic chamber and activated with a constant air flow, produced by an external air-compressor. Thus, a long-term steady state response was possible to obtain. Multichannel acoustic vector sensor was used to measure the sound intensity distribution of radiated acoustic energy. Measurements have been carried out on a defined fixed grid of points. A specialized Cartesian robot allowed for a precise positioning of the acoustic probe. The resulted data were processed in order to obtain and visualize the sound intensity distribution around the pipe, taking into account the type of the organ pipe, frequency of the generated sound, the sound pressure level and the direction of acoustic energy propagation. For the open pipe, an additional sound source was identified at the top of the pipe. In this case, the streamlines in front of the pipe are propagated horizontally and in a greater distance than in a case of the stopped pipe, moreover they are directed downwards. For the stopped pipe, the streamlines of the acoustic flow were directed upwards. The results for both pipe types were compared and discussed in the paper.
Niniejszy artykuł odnosi się do aktualnego stanu technologii wykorzystywanych w cyfrowych aparatach słuchowych, ze szczególnym uwzględnieniem technik cyfrowego przetwarzania sygnałów dźwiękowych. W artykule przedstawiono czynniki mające wpływ na efektywność aparatów słuchowych, a także zaprezentowano przykłady nowoczesnych metod cyfrowego przetwarzania sygnałów. Przedstawiono również przykłady ograniczeń współczesnych aparatów słuchowych oraz kierunki ich rozwoju. Przywołano również pojęcie analizy sceny dźwiękowej (CASA - Computational Auditory Scene Analysis) jako potencjalnej metody do polepszenia jakości odbioru mowy i muzyki w aparatach słuchowych.
This paper presents a short survey on current technology available in hearing aids with a focus on digital signal processing techniques used. First, factors influencing the hearing aid effectiveness are introduced. Then, examples of the current DSP methods and strategies are shown. Also, a description of existing limitations of hearing aids and future trends of development are provided. Finally, the notion of computational auditory scene analysis is presented as a possible solution for improving quality of speech and music perception while using a hearing prosthesis.
Projektowanie adaptacji akustycznej pomieszczeń jest złożonym procesem, który wymaga możliwości przewidywania wpływu zastosowanych ustrojów akustycznych na sposób propagacji fal akustycznym w pomieszczeniu. Przykładem ustroju stosowanego do korekcji akustyki pomieszczeń jest dyfuzor akustyczny. Niniejsza praca opisuje proces pomiaru oraz numerycznej symulacji rozkładu wektora natężenia dźwięku w pobliżu dyfuzora. Analiza tego rozkładu pozwala zaobserwować zjawisko transportu energii akustycznej w pobliżu badanego obiektu. Wyniki badań przedstawiono w formie graficznej. Przygotowane zostały także mapy różnic pomiędzy rozkładem wektora natężenia dźwięku zmierzonego bez i z dyfuzorem. Jako obiekt referencyjny wykorzystana została płaska powierzchnia odbijająca. Dzięki takiemu podejściu możliwe było zaobserwowanie i opisanie wpływu zjawiska rozproszenia dźwięku przez dyfuzor na rozkład otaczającego pola akustycznego.
Acoustic treatment of rooms is a complex task which is often connected with simulation of the impact of used acoustic systems on the propagation of sound waves in the place of interest. An example of such sound system is the acoustic diffuser. In this work, we present a process of the measurement and numerical simulation of the sound intensity vector distribution in the proximity of the acoustic diffuser. This distribution may provide useful information related to the phenomena of energy transport in the sound field surrounding the diffuser. Results of the measurement and simulation are visualized in the form of grayscale maps of the sound intensity vector absolute value and arrows denoting its direction and sense. There are three types of measured sound field: one without any obstacle in front of the sound source, one with the diffuser placed in front of the source and the last one with the smooth reflecting plate in front of the source. The second and the third scenarios are used as references for the first measurement. Such an approach allowed the calculation of the map of differences between the acoustic field with the obstacle and without the obstacle in front of the sound source and a better visualization of the impact of those acoustic devices on the sound field.
W artykule została przedstawiona koncepcja automatycznego systemu korekcji z uwzględnieniem charakterystyki częstotliwościowej pomieszczenia oraz odtwarzanego gatunku muzycznego. Proponowany algorytm na podstawie charakterystyki częstotliwościowej pomieszczenia dokonuje kompensacji warunków akustycznych w otoczeniu emitera dźwięku. Dodatkowo w procesie kompensacji uwzględniana jest zawartość sygnału poprzez rozpoznanie rodzaju gatunku muzycznego. W artykule zostały pokrótce przedstawione parametry wykorzystywane w procesie rozpoznawania gatunków w kontekście liczby pasm częstotliwościowych użytych w korekcji dźwiękowej. Ponadto pokrótce omówiono środowisko Faust, w którym zaprojektowano korektor graficzny.
A research study presents investigations of the influence of the room acoustics on the frequency characteristic of the audio signal playback. First, a concept of a novel spectral equalization method of the room acoustic conditions is introduced. On the basis of the frequency response of the room, a system for room acoustics compensation based on a designed equalizer is proposed. The system settings depend on music genre recognized automatically. In order to acquire room acoustic characteristics, a series of measurements are performed. Feature vector used in the process of identifying music genres is discussed in the context of the number of frequency bands designated for the equalizer proposed. Also, the Faust programming environment, in which the proposed equalizer is designed, is shortly outlined.
Celem badań jest poszukiwanie parametrów wektora cech ekstrahowanego z sygnału fonicznego w kontekście automatycznego rozpoznawania stanu nawierzchni jezdni oraz typu pojazdów. W pierwszej kolejności przedstawiono wpływ warunków pogodowych na charakterystykę widmową sygnału fonicznego rejestrowanego przy przejeżdżających pojazdach. Następnie, dokonano parametryzacji sygnału fonicznego oraz przeprowadzano analizę korelacyjną w celu przedstawienia separowalności klas na podstawie ekstrahowanych parametrów. W procesie optymalizacji proponowanego wektora cech wykorzystano statystykę Behrensa-Fishera.
The aim of this study is to find a feature vector for an automatic recognition of road surface conditions and the type of vehicles, extracted form an audio signal. First, the influence of weather-based conditions of road surface on spectral characteristic of the audio signal recorded from a passing vehicle in close proximity to the road is shortly discussed. Next, parameterization of the recorded audio signal is performed and examples of the correlation analyses are presented in the context of the class separability. Behrens-Fisher statistics is used to find the most suitable parameters that may be contained in the optimized feature vector.
W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus może być wykorzystany do badania wpływu zakłóceń na skuteczność rozpoznawania mowy.
An audiovisual corpus containing 31 hours of English speech recordings is presented. The new corpus was created in order to assist the development of audiovisual speech recognition systems (AVSR). The corpus includes high-framerate stereoscopic video streams and audio recorded by both microphone array and a microphone built in a mobile computer. Owing to the inclusion of recordings made in noisy conditions, the corpus can be used to assess the robustness of speech recognition systems in the presence of acoustic noise.
A system setup for measurements of acoustic field, together with the results of 3D visualisations of acoustic energy flow are presented in the paper. Spatial sampling of the field is performed by a Cartesian robot. Automatization of the measurement process is achieved with the use of a specialized control system. The method is based on measuring the sound pressure (scalar) and particle velocity(vector) quantities. The aim of the system is to collect data with a high precision and repeatability. The system is employed for measurements of acoustic energy flow in the proximity of an artificial head in an anechoic chamber. In the measurement setup an algorithm for generation of the probe movement path is included. The algorithm finds the optimum path of the robot movement, taking into account a given 3D object shape present in the measurement space. The results are presented for two cases, first without any obstacle and the other - with an artificial head in the sound field.
In the paper, a noise map service designated for the user interested in environmental noise is presented. Noise prediction algorithm and source model, developed for creating acoustic maps, are working in the cloud computing environment. In the study, issues related to the noise modelling of sound propagation in urban spaces are discussed with a particular focus on traffic noise. Examples of results obtained through a web application created for that purpose are shown. In addition, these are compared to results obtained from the commercial software simulations based on two road noise prediction models. Moreover, the computing performance of the developed application is investigated and analyzed. In the paper, a flowchart simulating the operation of the noise web-based service is presented showing that the created application is easy to use even for people with little experience in computer technology.
The primary aim of this research study was to model acoustic conditions of the Courtyard of the Gdańsk University of Technology Main Building, and then to design a sound reinforcement system for this interior. First, results of measurements of the parameters of the acoustic field are presented. Then, the comparison between measured and predicted values using the ODEON program is shown. Collected data indicate a long reverberation time which results in poor speech intelligibility. Then, a thorough analysis is perform to improve the acoustic properties of the model of the interior investigated. On the basis of the improved acoustic model two options of a sound reinforcement system for this interior are proposed, and then analyzed. After applying sound absorbing material it was noted that the predicted speech intelligibility increased from bad/poor rating to good category.
The main goal of this research study is focused on creating a method for loudness scaling based on categorical perception. Its main features, such as: way of testing, calibration procedure for securing reliable results, employing natural test stimuli, etc., are described in the paper and assessed against a procedurę that uses 1/2-octave bands of noise (LGOB) for the loudness growth estimation. The Mann-Whitney U-test is employed to check whether the proposed method is statistically equivalent to LGOB. It is shown that loudness functions obtained in both methods are similar in the statistical context. Moreover, the band-filtered musical instrument signals are experienced as more pleasant than the narrow-band noise stimuli and the proposed test is performed in a shorter time. The method proposed may be incorporated into fitting hearing strategies or used for checking individual loudness growth functions and adapting them to the comfort level settings while listening to music.
first rewind previous Strona / 4 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.