Przedstawiono wybrane problemy współczesnego rozpoznania w nowej generacji broni. Wskazano na duże możliwości operacyjne broni inteligentnej. Zilustrowano prawdopodobieństwo detekcji i fałszywego alarmu w funkcji poziomu progu detekcji.
Artykuł przedstawia najnowsze wyniki prac autora w dziedzinie automatycznego rozpoznawania sygnałów mowy. Wyniki badań prowadzonych na zbiorze 500 nagrań cyfr wypowiadanych w języku polskim przez 50 mówców różnej płci i w różnym wieku pozwalają na zaproponowanie zestawu parametrów niezbędnych do przeprowadzenia procesu ich identyfikacji. Jak pokazano w artykule zestaw kilku podstawowych cech identyfikujących jest wystarczający aby taki proces przeprowadzić. Zaproponowany zestaw parametrów jest łatwy do uzyskania przy niewielkiej mocy obliczeniowej.
The paper describes a new author's method for automatic recognition of digits spoken in Polish. In this new approach there are no frequency analyses as used to be made in such systems but the image recognition of the time characteristic is applied. Investigations performed on 500 records of people of different sex and age showed that there was possibility of constructing an automatic recognition system based on a few parameters. The first is the number of voiced phonemes included in a recognized word (Tab. 1). In this group there are all wavelets and some consonants. They include basic periods inside their time characteristics. This parameter is obtained using the grid method designed by the author (Fig. 3). The second one is the number and position of noisy phonemes. To this group there belong phonemes without basic periods but with big signal variety. This parameter is calculated using the number of local extrema, the signal amplitude level and checking if there are no basic periods. The third parameter is the shape of a signal envelope (Tab. 2). As investigations showed, it is possible to find the envelope pattern for each Polish digit common for all tested speakers. It was proved that these parameters are sufficient for automatic speech recognition of digits spoken in Polish. This new method can also be applied to other systems with small number of recognized words. It is fast and lack of frequency analyses causes that it has low hardware demands.
W badaniach nad automatycznym rozpoznawaniem sygnałów mowy notuje się stały postęp, choć różnorodność języków utrudnia wprowadzenie jednakowych rozwiązań. Przykładem rozwoju i upowszechnienia metod identyfikacji mowy może być system operacyjny Windows XP, w którym zamieszczono narzędzia do sterowania aplikacjami za pomocą sygnałów głosowych. Brak jednak nadal rozwiązań dla języka polskiego, co sprawia że potrzebne są badania zmierzające do opracowania niezawodnych algorytmów identyfikujących i sterujących. W artykule przedstawiono wyniki badań obwiedni sygnałów mowy, będących cyframi z zakresu 0-9, uzyskanych dla grupy 50-ciu osób różnych płci i w różnym wieku. Celem przeprowadzonych badań było uzyskanie odpowiedzi na pytanie, czy analiza obwiedni może stanowić parametr w procesie automatycznego rozpoznawania sygnałów mowy i czy jest możliwe stworzenie modeli obwiedni dla każdej z cyfr, które byłyby wspólne dla wszystkich (50) mówców.
In scientific research on the speech signal recognition there can be noted great development, although differences between languages make it difficult to work out the same algorithms for all of them. A good example of the big progress in this field can be Windows XP, an operating system which enables controlling some applications by voice (but not in Polish). There is still lack of good working programs controlled by Polish. In this paper the results of investigations on the voice signal envelope are described. There were tested digital recordings, from the range 0 - 9, obtained for 50 persons of different age and sex . The main goal was to find out if the envelope analysis could be helpful in automatic speech recognition. During the investigations basing on the analysis of the digit time characteristic, each digit was divided into parts (from 2 to 5) having the similar envelope. Also the minimum duration and the amplitude range were found for each part. The results are given in Table 1. Table 2 contains the results of fitting the envelope to each digit. It is shown that the envelope patterns are common for all the speakers and digits. Although the envelope analysis is not sufficient alone for automatic speech recognition (some digit patterns fit to the others), it can be used as one of the parameters employed for this purpose.
The aim of this study was to develop a music genre classifier using convolutional neural networks and to compare its performance with a traditional algorithm based on support vector machines. A distinct feature of the proposed approach was to utilize two-channel stereo signals at the input of the convolutional network. The proposed method yielded similar results compared to those obtained with the traditional approach, demonstrating the potential of the proposed method and indicating the need for its further optimization. Using two-channel stereo signals at the input of the algorithm showed no improvements over the baseline method exploiting single-channel recordings, suggesting that monaural signals fed to the convolutional network might be sufficient to undertake the task of music genre recognition. According to the results, the network ‘prioritized’ the temporal changes over the frequency variations of the signals. This observation tentatively implies that the classifiers specifically designed to account for temporal changes might potentially better serve the task of music genre recognition than the convolutional neural networks.
Celem niniejszej pracy było opracowanie klasyfikatora gatunków muzycznych z użyciem splotowych sieci neuronowych i porównanie go z tradycyjnym algorytmem opartym na maszynie wektorów wspierających. Wyróżniającą cechą zaproponowanego podejścia było wykorzystanie dwu-kanałowego dźwięku stereofonicznego na wejściu sieci splotowej. Zaproponowana metoda dała podobne wyniki do rezultatów otrzymanych z użyciem podejścia tradycyjnego, demonstrując potencjał zaproponowanej metody oraz wskazując na potrzebę jej dalszej optymalizacji. Wykorzystanie dwu-kanałowego dźwięku stereofonicznego na wejściu algorytmu nie poprawiło wyników w porównaniu z metodą bazową wykorzystującą nagrania jednokanałowe, sugerując, iż zastosowanie dźwięków monofonicznych na wejściu splotowej sieci neuronowej jest adekwatne do celów rozpoznawania gatunków muzycznych. Zgodnie z uzyskanymi wynikami, sieć potraktowała priorytetowo zmiany czasowe w porównaniu ze zmianami częstotliwościowymi sygnałów. Obserwacja ta pozwala wstępnie przypuszczać że klasyfikatory specjalnie zaprojektowane, by uwzględnić zmiany czasowe, potencjalnie mogłyby lepiej służyć celom rozpoznawania gatunków muzycznych niż neuronowe sieci splotowe.
More and more cities implement solution for motorized traffic reduction in separate areas of the cities. These areas include mostly cultural and historic centers, promenades and often all centers of large cities. To achieve traffic reduction, special fees for entrance to the city center are introduced and special bus lanes for emergency vehicles and public transport are isolated. Such solutions with paid or limited entrance to city centers occur in London and Berlin and dedicated bus lanes has also appeared in Poland in the major urban centers. These examples are often referred by the authorities of other cities wishing to introduce similar schemes. In order to effectively enforce the respect for the rules in Limited Traffic Zones automatic monitoring and supervision solutions are introduced. Automatic Number Plate Recognition (ANPR or ALPR – Automatic License Plate Recognition) is one of the elementary and most widely used system for LTZ security and effectiveness. ANPR allows the identification of the vehicles that appear on the entrances to the Limited Traffic Zone or move within the zone (for example, the bus lane). This article presents an implemented and successfully operating automatic Limited Traffic Zone in Katowice.
W artykule przedstawiono układ do automatycznego rozpoznawania typu przetwornika prądowego podłączonego do urządzenia pomiarowego oraz sposób wyznaczania parametrów obwodu zastępczego RLC przetwornika. Rozwiązanie dedykowane jest do zastosowania w obwodach pomiarowych urządzeń automatyki i zabezpieczeń sieci elektroenergetycznych oraz w przenośnych i stacjonarnych urządzeniach pomiarowych.
In the paper the circuit for automatic detection of the type of current transducer connected to the measurement device as well as the method of estimating the parameters of its electrical equivalent electrical circuit have been presented. The solution is dedicated for use in measurement circuits of protection and automation devices used in power industry as well as other measurement devices.
Opisano najpoważniejszy problem budowy generacyjnego systemu wspomagającego planowanie procesów technologicznych, którym jest identyfikacja technologicznych obiektów elementarnych (TOE). W Instytucie Technologii Maszyn i Automatyzacji Politechniki Wrocławskiej trwają prace nad zbudowaniem generacyjnego systemu CAPP. Zawiera on dedykowany system ekspertowy, który wspomaga realizację wybranych zagadnień opracowania procesu technologicznego, w tym identyfikację TOE.
This paper describes problems related to automatic feature recognition in computer aided process planning (CAPP). First, the main problem of recognition methods - features interaction - is explained. In the second section hint-based approach and cell based decomposition are presented as examples of methods which deal with features interactions. Limitations of these methods are depicted.
In this paper we propose procedures for detection and recognition of main groups of vertical road signs. The algorithm is intended for the use in vehicles, thus it is optimized to work in real-time. The described recognition process consists of several following stages. At first we are reducing the number of colors using the minimum variance quantization and changing the representation of an input video to the indexed color images. By this step the total amount of data is significantly reduced without decreasing the recognition quality. Then we check, which objects in individual images of the examined video have similar colors to those of particular road signs. To solve this problem, i. e., to determine proper RGB dependencies for the color-based segmentation of real world scenes, we use perceptive color spaces such as HSI and JCh instead of, e. g., the RGB space. The next step is to determine, which regions from those just found in the previous step by the color matches exhibit the road sign like shapes. This classification is done by computing geometric moments and appropriate shape factors. As the meaning of most road signs lies in the shape of the symbol just inside the sign, the essential process consists in recognition of this symbol. Thus in the final stage we recognize and classify the sign symbols using an artificial neural network (ANN). Additionally we propose a procedure to detect road marking, which can be used to track the car position on the road. All presented procedures work in real-time and improve safety of driving and, in consequence, may possibly decrease numbers of accidents.
Artykuł przedstawia procedury wykrywania i rozpoznawania podstawowych grup pionowych znaków drogowych. Zaproponowany algorytm jest przeznaczony do zastosowania w pojazdach, w związku z tym jest przystosowany do pracy w czasie rzeczywistym. Przedstawiony proces rozpoznawania składa się z kilku etapów. W pierwszym, za pomocą kwantyzacji metodą minimalnej wariancji oraz przekształcenia wejściowych ramek wideo do obrazów z indeksowanym kolorem, jest redukowana liczba kolorów. Proces ten znacząco zmniejsza liczbę danych do przetworzenia bez istotnego pogorszenia jakości rozpoznawania. Następnie są wykrywane obiekty o kolorach zbliżonych do wykorzystywanych w znakach drogowych. Aby zminimalizować wpływ zmian oświetlenia i otoczenia na poprawne wykrywanie kolorów na tym etapie, zamiast klasycznej przestrzeni barw np. RGB, użyto przestrzeni percepcyjnych takich jak HSI i JCh. W kolejnym kroku w obszarach o dopasowanych kolorach, za pomocą momentów geometrycznych i współczynników kształtu, są wykrywane kształty znaków. Ponieważ znaczenie większości znaków określają symbole umieszczone wewnątrz znaków, kluczową procedurą jest wykrycie i rozpoznanie tych symboli. Ten etap został zrealizowany za pomocą sztucznych sieci neuronowych. Dodatkowo zaproponowano procedurę wykrywającą wybrane znaki poziome, jakimi są linie rozdziału pasów ruchu. Wyniki zostaną wykorzystywane do śledzenia trajektorii pojazdu, co w połączeniu z pozostałymi procedurami, może przyczynić się do zwiększenia bezpieczeństwa na drogach i zmniejszenia liczby kolizji i wypadków.
Author presents sign language features that can provide the basis of the sign language automatic recognition systems. Using parameters like position, velocity, angular orientation, fingers bending and the conventional or derivative dynamic time warping algorithms classification of 95 signs from the AUSLAN database was performed. Depending on the number of parameters used in classification different accuracy values were obtained (defined as the ratio of correctly recognized gestures to all gestures from test set), with the highest value 87.7% for the case of classification based on all the features and the derivative dynamic time warping method.
In this paper, we performed recognition of isolated sign language gestures - obtained from Australian Sign Language Database (AUSLAN) – using statistics to reduce dimensionality and neural networks to recognize patterns. We designated a set of 70 signal features to represent each gesture as a feature vector instead of a time series, used principal component analysis (PCA) and independent component analysis (ICA) to reduce dimensionality and indicate the features most relevant for gesture detection. To classify the vectors a feedforward neural network was used. The resulting accuracy of detection ranged between 61 to 87%.
W prezentowanej pracy skoncentrowano się na organizacji muzyki w kontekście zawartych w niej emocji. Zaproponowano wektor parametrów opisujących nastrój oraz stworzono autorski graficzny model emocji dedykowany do subiektywnej notacji emocji zawartych w muzyce. Przeprowadzono serię testów subiektywnych oraz automatyczne rozpoznawanie nastroju muzyki z wykorzystaniem wybranych algorytmów sztucznej inteligencji oraz porównano otrzymane wyniki.
This work is focused on an approach based on the emotional content of music and its automatic recognition. A vector of features describing emotional content of music was proposed. Additionally, a graphical model dedicated to the subjective evaluation of mood of music was created. A series of listening tests was carried out, and results were compared with automatic mood recognition employing SOM (Self Organizing Maps) and ANN (Artificial Neural Networks).
Content available Specjalizowany system ARTR kontroli ruchu drogowego
W artykule przedstawiono zintegrowany system zarządzania, kontroli i nadzoru ruchu drogowego. Podstawą systemu są rozwiązania technologiczne wykorzystujące Automatyczne Rozpoznawanie Tablic Rejestracyjnych (ARTR). Pozwala to na automatyczną ewidencję ruchu pojazdów wraz z przesyłaniem i gromadzeniem rezultatów w centralnej bazie danych. Analiza tych wyników pozwala na uzyskanie przez system funkcjonalności dostosowanych dla właściwych odbiorców (służb drogowych, służb bezpieczeństwa, itp). Z uwagi na konieczność przetwarzania informacji w czasie rzeczywistym realizacja systemu opiera się w dużej mierze na rozwiązaniach sprzętowych. Przykładem są dedykowane kamery ARTR będące zintegrowanymi urządzeniami realizującymi sprzętowo większość operacji przetwarzania i rozpoznawania obrazu. Artykuł przedstawia architekturę systemu oraz kierunki dalszych prac nad udoskonaleniami. Uniwersalności systemu nadaje możliwości zastosowania w obszarach bezpieczeństwa, bezpieczeństwa ruchu drogowego, ITS - kontroli i zarządzania ruchem drogowym.
In the paper a traffic control system is presented. It is based on automatic license plate recognition (ALPR). This solution allows automatic traffic evidence with the results being transferred and stored in central database. The analysis of these results enables obtaining the functionality adjusted to the specific recipient like traffic service or security forces. Such a system requires fast and accurate data processing, which means using dedicated hardware solutions as, in example, in a dedicated ALPR camera. This kind of cameras are devices which integrate most of image processing and image recognition in hardware. The paper presents the structure and basic concepts of the VirtualCOP system realized by Telsat company [1]. In the first section essential parts of the automatic license plate recognition system is presented. It consists of three components: a control point, client application and a database server. In the next section key elements of the most significant procedures are discussed: the automatic license plate detection, the number segmentation and, finally, the recognition process. The system architecture is presented in the third section. At the end of the paper there are conclusions and directions of future development of the system.
Potrzeba opracowania skutecznego algorytmu automatycznego rozpoznawania typów modulacji (ang. Automatic Modulation Recognition - AMR) stała się jednym z najważniejszych zagadnień związanych nie tylko z rozwojem systemów rozpoznania radioelektronicznego ale również systemów radia kognitywnego (ang. Cognitive Radio - CR) budowanych w oparciu o radio programowalne (ang. Software Defined Radio - SDR). Praca zawiera opis jednego z proponowanych algorytmów rozpoznawania wybranych typów modulacji, w którym zastosowano transformację falkową (ang. Wavelet Transform - WT) oraz sztuczną sieć neuronową (ang. Artificial Neural Network - ANN). Opisane w pracy badania dotyczyły możliwości identyfikacji następujących modulacji cyfrowych: M-QAM, M-PSK, M-ASK, M-FSK. Transformację falkową zastosowano w celu wyodrębnienia cech charakterystycznych dla każdego z rozpoznawanych typów modulacji. Natomiast jako klasyfikator zastosowano dwa rodzaje sztucznej sieci neuronowej: perceptron wielowarstwowy (ang. Multi-Layer Perceptrone - MLP) oraz sieć radialną (ang. Radial Basis Function - RBF) oraz porównano ich skuteczność. Badania wykonano z wykorzystaniem środowiska MatLab oraz własnych klas i funkcji pozwalających na realizację funkcjonalności sztucznych sieci neuronowych. Przedstawiono problemy zaobserwowane podczas realizacji badań, w szczególności związane z identyfikacją poziomu modulacji dla kluczowania fazy (M-PSK).
Signal intelligence (SIGINT) and cognitive radio (CR) systems are in need of effective, automatic modulation recognition (AMR) algorithm. This task has became one of the most important problems to solve since last ten years. The article presents one of the proposed modulation recognition algorithms where continuous wavelet transform (CWT) is used for signal features extraction and artificial neural network (ANN) acts as classifier. In our researches multilayer perceptron (MLP) and radial basis function (RBF) network were considered and correctness of classification was analyzed. There are M-ary ASK, M-ary PSK, M-ary FSK, M-ary QAM signals used for simulation. The mean value, variance and higher-order moments up to five of continuous wavelet transform (CWT) were taken to consideration as signal features. Principal component analysis (PCA) was applied to reduce number of features. There were two variants analyzed: interclass and intraclass recognition with wide range of signal-to-noise ratio (SNR). In researches we used collection of class and functions created in MatLab code for learning and testing ANN. There are also problems with M-ary PSK intraclass identification problems analyzed.
