Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 48

Liczba wyników na stronie
first rewind previous Strona / 3 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  rozpoznawanie obrazu
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 3 next fast forward last
EN
The grain and milling industry deals with the grinding of grain into flour and groats. These processes take place in mills. During the technological process of producing flour and groats, contamination may occur, which reduces the quality of end products. Before the product is introduced into the consumption cycle, the flours and groats are subjected to laboratory analysis, including in terms of product purity. This analysis is based on the organoleptic determination of the amount of contamination in flour and grain products using the sense of sight. The article presents innovative techniques for assessing the quality of the pollution level using image analysis and artificial neural networks (ANNs). Wheat flour was used for laboratory tests.
PL
Przemysł zbożowo-młynarski zajmuje się przemiałem zboża na mąkę i kasze. Procesy te odbywają się w młynach. W czasie procesu technologicznego produkcji mąki oraz kasz, może dojść do zanieczyszczeń, co powoduje obniżenie jakości produktów końcowych. Przed wprowadzeniem produktu do obiegu konsumpcyjnego, mąki i kasze poddawane są analizie laboratoryjnej, między innymi pod względem czystości produktu. Analiza ta polega na organoleptycznym określeniu za pomocą zmysłu wzroku ilości zanieczyszczeń w mące i przetworach zbożowych. W artykule przedstawiono innowacyjne techniki oceny jakości poziomu zanieczyszczeń wykorzystujące analizę obrazu oraz sztuczne sieci neuronowe (SSN). Do badań laboratoryjnych wykorzystano mąkę pszenną.
EN
The paper describes the possibility of using, building, and implementing an image recognition system in a company performing remanufacturing processes. It is based on a thesis prepared with the help of Wabco Reman Solutions. The tests were conducted using one of the parts remanufactured by the company – a manifold. The research focuses on different variants of the obtained image recognition models in order to identify differences that may affect their effectiveness and possible application in real work conditions. The environment used to build the models is Jupyter Notebook, and convolutional neural networks were implemented.
PL
W artykule opisano możliwości wykorzystania, budowy i wdrożenia systemu rozpoznawania obrazu w firmie realizującej proces regeneracji. Artykuł powstał na podstawie pracy magisterskiej przygotowanej przy pomocy Wabco Reman Solutions. Przeprowadzone testy zostały wykonane na jednej z regenerowanych części w firmie - kolektorze. W badaniach skupiono się na różnych wariantach powstałych modeli rozpoznawania obrazów w celu dostrzeżenia różnic, które mogą wpłynąć na ich skuteczność i możliwość zastosowania w rzeczywistych warunkach pracy. Do budowy modeli, w których zaimplementowano konwolucyjne sieci neuronowe, wykorzystano środowisko Jupyter Notebook.
PL
W niniejszym artykule przedstawiono koncepcję i implementację modelu do rozpoznawania ras psów na podstawie zdjęcia. Do realizacji zadania wykorzystano model głębokiej sieci neuronowej bazujący na strukturze InceptionV3. Sieć została wytrenowana i przetestowana na zbiorze przypadków uczących liczącym ponad 20 tys. zdjęć 120 ras psów z zastosowaniem transferu wiedzy. Zbadano również wpływ jakości zdjęć na wyniki klasyfikacji. Sieć uzyskała bardzo dobre rezultaty zarówno w przypadku analizy typowych, jak i nietypowych zdjęć.
EN
This article presents the concept and implementation of a model for recognizing dog breeds based on an input image. The task was performed with the use of a deep neural network model based on the InceptionV3 structure. The neural network has been trained and tested on a dataset counting more than 20,000 images of 120 dog breeds using transfer learning technique. The impact of image quality on classification results was also examined. The model obtained very good results in the analysis of both typical and unusual input images.
4
EN
The identity of a language being spoken has been tackled over the years via statistical models on audio samples. A drawback of these approaches is the unavailability of phonetically transcribed data for all languages. This work proposes an approach based on image classification that utilized image representations of audio samples. Our model used Neural Networks and deep learning algorithms to analyse and classify three languages. The input to our network is a Spectrogram that was processed through the networks to extract local visual and temporal features for language prediction. From the model, we achieved 95.56 % accuracy on the test samples from the 3 languages.
EN
Augmented reality (AR) is a modern technology which integrates 3D virtual objects into the real environment in real time. It can be used for many purposes, which should improve different processes in daily life. The paper will analyze the areas in which this technology is currently used. First, the history of the development of augmented reality will be recalled. Then, this technology will be compared to virtual reality because these terms are often incorrectly used interchangeably. This paper describes the tools and popular platform solutions related to augmented reality. The most common problems related to the use of this technology will be discussed, including popular approaches concerning optical and video combining methods. The existing applications and their potential in solving everyday problems will be analyzed. Finally, the perspectives for the development of augmented reality and its possibilities in the future will be discussed. This paper provides a starting point for using and learning about augmented reality for everyone.
EN
This article describes the architecture of the Hamming-Lippmann neural network and the math of the modified learning-recognition algorithm and presents some practical aspects for using it for solving an image recognition task. We have created software using C# programming language, that utilized this network as an additional error-correcting procedure, and have solved the task of recognition highly corrupted QR codes (with a connection to the database). Experimental results, of finding the optimal parameters for this algorithm, are presented. This neural network doesn’t require time-consuming computational procedures and large amounts of memory, even for high-resolution and big size images.
PL
W tym artykule opisano architekturę sieci neuronowej Hamminga-Lippmanna oraz matematykę zmodyfikowanego algorytmu rozpoznawania uczenia się, a także przedstawiono kilka praktycznych aspektów korzystania z niej w celu rozwiązania zadania rozpoznawania obrazu. Stworzyliśmy oprogramowanie wykorzystujące język programowania C #, który wykorzystał tę sieć jako dodatkową procedurę korekty błędów i rozwiązaliśmy zadanie rozpoznawania wysoce uszkodzonych kodów QR (w połączeniu z bazą danych). Przedstawiono wyniki eksperymentalne poszukiwania optymalnych parametrów dla tego algorytmu. Opisywana neuronowa nie wymaga czasochłonnych procedur obliczeniowych i dużej ilości pamięci, nawet w przypadku obrazów o wysokiej rozdzielczości i dużych rozmiarach.
PL
Ten dwuczęściowy artykuł przedstawia interfejs do Narodowej Platformy Cyberbezpieczeństwa (NPC). Wykorzystuje on gesty i komendy wydawane głosem do sterowania pracą platformy. Ta część artykułu przedstawia strukturę interfejsu oraz sposób jego działania, ponadto prezentuje zagadnienia związane z jego implementacją. Do specyfikacji interfejsu wykorzystano podejście oparte na agentach upostaciowionych, wykazując że podejście to może być stosowane do tworzenia nie tylko systemów robotycznych, do czego było wykorzystywane wielokrotnie uprzednio. Aby dostosować to podejście do agentów, które działają na pograniczu środowiska fizycznego i cyberprzestrzeni, należało ekran monitora potraktować jako część środowiska, natomiast okienka i kursory potraktować jako elementy agentów. W konsekwencji uzyskano bardzo przejrzystą strukturę projektowanego systemu. Część druga tego artykułu przedstawia algorytmy wykorzystane do rozpoznawania mowy i mówców oraz gestów, a także rezultaty testów tych algorytmów.
EN
This two part paper presents an interface to the National Cybersecurity Platform utilising gestures and voice commands as the means of interaction between the operator and the platform. Cyberspace and its underlying infrastructure are vulnerable to a broad range of risk stemming from diverse cyber-threats. The main role of this interface is to support security analysts and operators controlling visualisation of cyberspace events like incidents or cyber-attacks especially when manipulating graphical information. Main visualization control modalities are gesture- and voice-based commands. Thus the design of gesture recognition and speech-recognition modules is provided. The speech module is also responsible for speaker identification in order to limit the access to trusted users only, registered with the visualisation control system. This part of the paper focuses on the structure and the activities of the interface, while the second part concentrates on the algorithms employed for the recognition of: gestures, voice commands and speakers.
PL
Ten dwuczęściowy artykuł przedstawia interfejs do Narodowej Platformy Cyberbezpieczeństwa (NPC). Wykorzystuje on gesty i komendy wydawane głosem do sterowania pracą platformy. Ta część artykułu przedstawia strukturę interfejsu oraz sposób jego działania, ponadto prezentuje zagadnienia związane z jego implementacją. Do specyfikacji interfejsu wykorzystano podejście oparte na agentach upostaciowionych, wykazując że podejście to może być stosowane do tworzenia nie tylko systemów robotycznych, do czego było wykorzystywane wielokrotnie uprzednio. Aby dostosować to podejście do agentów, które działają na pograniczu środowiska fizycznego i cyberprzestrzeni, należało ekran monitora potraktować jako część środowiska, natomiast okienka i kursory potraktować jako elementy agentów. W konsekwencji uzyskano bardzo przejrzystą strukturę projektowanego systemu. Część druga tego artykułu przedstawia algorytmy wykorzystane do rozpoznawania mowy i mówców oraz gestów, a także rezultaty testów tych algorytmów.
EN
This two part paper presents an interface to the National Cybersecurity Platform utilising gestures and voice commands as the means of interaction between the operator and the platform. Cyberspace and its underlying infrastructure are vulnerable to a broad range of risk stemming from diverse cyber-threats. The main role of this interface is to support security analysts and operators controlling visualisation of cyberspace events like incidents or cyber-attacks especially when manipulating graphical information. Main visualization control modalities are gesture- and voice-based commands. Thus the design of gesture recognition and speech-recognition modules is provided. The speech module is also responsible for speaker identification in order to limit the access to trusted users only, registered with the visualisation control system. This part of the paper focuses on the structure and the activities of the interface, while the second part concentrates on the algorithms employed for the recognition of: gestures, voice commands and speakers.
9
Content available remote Three-dimensional reconstruction of hand using stereoscopic images
EN
This article is devoted to works on using natural user interfaces (NUI) in computer support systems of aircraft service. The concept of such interfaces involves the usage in human-machine communication the same measures as in the communication between people, that is sound or gesture. In the case of gesture communication, it is indispensable to adopt methods related to computer vision algorithms. One of them is a three-dimensional reconstruction of objects based on processing techniques of a pair of two-dimensional images. The above method and the results of its application were presented to obtain a three-dimensional cloud of points describing the hand shape. The obtained software will constitute an element of gesture classifier based on the analysis of the spatial location of the acquired points of the cloud.
PL
Artykuł dotyczy prac nad wykorzystaniem naturalnych interfejsów użytkownika w komputerowych systemach wspomagania obsługi statków powietrznych. Koncepcja tego typu interfejsów zakłada wykorzystanie w komunikacji człowiek-komputer takich samych środków jak w komunikacji między ludźmi, a więc głosu lub gestu. W przypadku komunikacji za pomocą gestów konieczne jest zastosowanie metod związanych z algorytmami komputerowego widzenia. Jedną z nich jest trójwymiarowa rekonstrukcja obiektów oparta na technikach przetwarzania pary dwuwymiarowych obrazów. Przedstawiono tę metodę oraz wyniki jej zastosowania w celu uzyskania trójwymiarowej chmury punktów opisujących kształt dłoni. Uzyskane oprogramowanie będzie stanowić element klasyfikatora gestów opartego na analizie lokalizacji przestrzennej otrzymanych punktów chmury.
PL
Celem artykułu jest porównanie dwóch metod rozpoznawania gatunków grzybów. W artykule zostały opisane dwie metody oparte na jednych z najpopularniejszych rozwiązań w dziedzinie image recognition, czyli Tensorflow oraz OpenCV. Do przeprowadzenia badań stworzono aplikację mobilną, w której obie metody zostały zaimplementowane oraz przetestowane. Dodatkowo aplikację wyposażono w mechanizmy ułatwiające zbieranie danych o aplikacji oraz algorytmach. Rezultaty badań wykazały, iż metoda oparta o Tensorflow o 9% skuteczniej rozpoznaje gatunki grzybów.
EN
The aim of the article is to compare two methods for identifying mushroom species. In article, two methods based on one of the most popular solutions in the field of image recognition, Tenosorflow and OpenCV, have been described. A research application was created to carry out the research, in which both algorithms were implemented and tested. In addition, the application was equipped with mechanisms facilitating the collection of application data and algorithms. The results of the research have show that the method based on Tensorflow by 9% more effectively recognizes mushroom species.
EN
Although the unimodal biometric recognition (such as face and palmprint) has higher convenience, its security is also relatively weak. The recognition accuracy is easy affected by many factors such as ambient light and recognition distance etc. To address this issue, we present a weighted multimodal biometric recognition algorithm with face and palmprint based on histogram of contourlet oriented gradient (HCOG) feature description. We employ the nonsubsampled contour transform (NSCT) to decompose the face and palmprint images, and the HOG method is adopted to extract the feature, which is named as HCOG feature. Then the dimension reduction process is applied on the HCOG feature and a novel weight value computation method is proposed to accomplish the multimodal biometric fusion recognition. Extensive experiments illustrate that our proposed weighted fusion recognition can achieve excellent recognition accuracy rates and outmatches the unimodal biometric recognition methods.
EN
Human Activity Recognition (HAR) is an important area of research in ambient intelligence for various contexts such as ambient-assisted living. The existing HAR approaches are mostly based either on vision, mobile or wearable sensors. In this paper, we propose a hybrid approach for HAR by combining three types of sensing technologies, namely: smartphone accelerometer, RGB cameras and ambient sensors. Acceleration and video streams are analyzed using multiclass Support Vector Machine (SVM) and Convolutional Neural Networks, respectively. Such an analysis is improved with the ambient sensing data to assign semantics to human activities using description logic rules. For integration, we design and implement a Framework to address human activity recognition pipeline from the data collection phase until activity recognition and visualization. The various use cases and performance evaluations of the proposed approach show clearly its utility and efficiency in several everyday scenarios.
EN
Due to the advances made in recent years, methods based on deep neural networks have been able to achieve a state-of-the-art performance in various computer vision problems. In some tasks, such as image recognition, neural-based approaches have even been able to surpass human performance. However, the benchmarks on which neural networks achieve these impressive results usually consist of fairly high quality data. On the other hand, in practical applications we are often faced with images of low quality, affected by factors such as low resolution, presence of noise or a small dynamic range. It is unclear how resilient deep neural networks are to the presence of such factors. In this paper we experimentally evaluate the impact of low resolution on the classification accuracy of several notable neural architectures of recent years. Furthermore, we examine the possibility of improving neural networks’ performance in the task of low resolution image recognition by applying super-resolution prior to classification. The results of our experiments indicate that contemporary neural architectures remain significantly affected by low image resolution. By applying super-resolution prior to classification we were able to alleviate this issue to a large extent as long as the resolution of the images did not decrease too severely. However, in the case of very low resolution images the classification accuracy remained considerably affected.
EN
The article concerns the issue of applying computer-aided systems of the maintenance of technical objects in difficult conditions. Difficult conditions shall be understood as these in which the maintenance takes place in a specific location making it hard or even preventing from using a computer. In these cases computers integrated with workwear should be used, the so-called wearable computers, with which the communication is possible by using hand gestures. The results of the analysis of the usefulness of one of methods of image recognition based on Viola-Jones algorithm were described. This algorithm enables to obtain the model of recognised image which might be used as a pattern in the application programme detecting a certain image.
PL
Artykuł dotyczy problematyki wykorzystania komputerowych systemów wspomagania obsługi obiektów technicznych w warunkach trudnych. Pod pojęciem warunków trudnych należy rozumieć takie warunki, w których obsługa odbywa się w specyficznej lokalizacji, utrudniającej lub wręcz uniemożliwiającej wykorzystanie komputera. W takich przypadkach należy stosować komputery zintegrowane z odzieżą roboczą operatora, tzw. komputery do noszenia (wearable computers), z którymi komunikacja odbywa się za pomocą gestów dłoni. Przedstawiono wyniki analizy przydatności jednej z metod detekcji obrazu opartej na algorytmie Violi-Jonesa. Algorytm ten pozwala na uzyskanie modelu rozpoznawanego obrazu, który może być wykorzystany następnie jako wzorzec w aplikacji wykrywającej dany obraz.
EN
In this paper, non-invasive method of recognition of finger skin was proposed. A plan of study of images of finger skin was proposed. Researches were carried out for three kinds of images: 60 h after injury, 160 h after injury, 450 h after injury. Proposed technique of recognition used methods of signal processing: extraction of magenta color, calculation of histogram, image filtration, calculation of perimeter, and K-NN classifier. A pattern creation process was conducted using 15 training images of finger skin. In the identification process 60 test images were used. The advantage of the presented method is analysis of the finger skin using a smartphone. The proposed approach will help to diagnose pathologies of human skin.
EN
Projection of a complicated geometry of industrial objects is the complex issue, which requires properly planned and prepared measurements. Such objects must be accurately inventoried, but their complicated nature often makes the access and the visibility of their entire surface very difficult. Documentation of measurements is often prepared in the form of sketches, plans or maps, which are amended with photographic documentation. The objective of this paper is to test the possibilities to apply laser scanning and the network of digital images for inventory and monitoring of technical conditions of industrial objects. Processing of a precise documentation acquired basing on terrestrial laser scanning data or dense points clouds generated from digital images still causes many difficulties and problems. Although data processing algorithms have been intensively developed with respect to generation of high resolution orthoimages or precise vector drawings, the existing problems are still connected with limitations related to imperfections of both techniques of measurements.
PL
W artykule przedstawiono metodę identyfikacji przesyłek pocztowych bazującej na przestrzeni parametrycznej przekształcenia Radona obrazów przedstawiających wybrane elementy przesyłek (znaki pola adresowego oraz znaczki pocztowe). Opracowano praktyczną realizację dyskretnego zmodyfikowanego przekształcenia Radona dla obrazów cyfrowych. Ponadto w pracy wyszczególniono podstawowe etapy przetwarzania elementów obrazu przesyłki oraz możliwości wykorzystania metody do weryfikacji opłat pocztowych. Skupiono szczególną uwagę na zagadnieniach związanych z realizacją przekształcenia Radona, pod kątem zastosowania w systemach logistycznych poczty.
EN
This paper presents a method to identify the postal items based on the parameter space of the Radon Transformation of selected images of mail pieces (characters from address area and postal stamps). Moreover we developed a practical implementation of the modified discrete Radon Transformation for digital images. In addition, this paper included basic mail pieces image processing steps and the possibility of using it to verifying postage payment. We focused attention on issues related to the implementation of the Radon Transform, for use in mail logistics systems.
Logistyka
|
2015
|
nr 3
4963--4970, CD 1
PL
W artykule dokonano przeglądu specjalistycznej literatury krajowej i międzynarodowej z dziedziny automatycznego zliczania pasażerów. Analiza wykazała, że większość artykułów dotyczy zastosowania systemów opartych o fotokomórki, kamery oraz rozpoznawanie obrazu. Metody te są skierowane przede wszystkim do przedsiębiorstw komunikacji zbiorowej charakteryzujących się dużą ilością tras oraz taboru przewozowego. Obecnie system APC pozwala na pozyskanie danych w czasie rzeczywistym nie tylko o napełnieniu danego pojazdu, ale także o kierunku i czasie podróży pasażerów oraz ich wadze czy wzroście. Ponadto dane otrzymane z systemu automatycznego zliczania pasażerów usprawniają pracę przewoźników oraz planistów poprzez optymalny dobór pojazdu, częstotliwości pomiędzy kursami, przebiegu trasy oraz rozliczenia za świadczone usługi transportowe. Natomiast dzięki wykorzystaniu odpowiedniej aplikacji, połączonej z centralnym serwerem, działającej na telefonach typu smartphone możliwe jest również przekazanie danych pasażerom posiadającym specjalną aplikację. Proponowane rozwiązanie dostarcza informacji o aktualnym stanie napełnienia, a także o możliwym opóźnieniu pojazdu.
EN
This article reviews the specialist national and international literature in the field of automatic passengers’ counting. The analysis showed that most of the articles relates to the use of systems based on photocells, camera and image recognition. These methods are intended mainly for the public transport companies characterized by a large number of transport routes and rolling stock. Currently, the system allows the acquisition of APC data in real time, not only about vehicle’s filling, but also the direction and time of passengers and their weight and growth. Furthermore, the data obtained from a system of automatic passenger counting carriers and improve the work of planners through the optimal selection of the vehicle, the frequencies between courses, routing and billing for the provision of transport services. In contrast, by using the appropriate application, combined with a central server, running on smartphones is also possible to transfer data to passengers with a dedicated application. The proposed solution provides information on the current status of the filling, as well as a possible deceleration of the vehicle.
PL
System rozpoznawania obiektów znajdujących się na drodze jest bardzo ważnym zagadnieniem z uwagi na bezpieczeństwo kierowców pojazdów samochodowych jak i pieszych uczestników ruchu drogowego. W artykule została przedstawiona koncepcja systemu rozpoznawania obiektów wykorzystującego dwuwymiarowe transformaty falkowe do przetwarzania obrazu.
EN
Recognition system objects on the road is a very important issue in view of the safety of drivers of motor vehicles and pedestrians road. In the paper presents the concept of object recognition system using wavelet transform two-dimensional imaging.
EN
The paper is focused on the problem of multi-class classification of composite (piecewise-regular) objects (e.g., speech signals, complex images, etc.). We propose a mathematical model of composite object representation as a sequence of independent segments. Each segment is represented as a random sample of independent identically distributed feature vectors. Based on this model and a statistical approach, we reduce the task to a problem of composite hypothesis testing of segment homogeneity. Several nearest-neighbor criteria are implemented, and for some of them the well-known special cases (e.g., the Kullback–Leibler minimum information discrimination principle, the probabilistic neural network) are highlighted. It is experimentally shown that the proposed approach improves the accuracy when compared with contemporary classifiers.
first rewind previous Strona / 3 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.