Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 101

Liczba wyników na stronie
first rewind previous Strona / 6 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  image recognition
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 6 next fast forward last
EN
The grain and milling industry deals with the grinding of grain into flour and groats. These processes take place in mills. During the technological process of producing flour and groats, contamination may occur, which reduces the quality of end products. Before the product is introduced into the consumption cycle, the flours and groats are subjected to laboratory analysis, including in terms of product purity. This analysis is based on the organoleptic determination of the amount of contamination in flour and grain products using the sense of sight. The article presents innovative techniques for assessing the quality of the pollution level using image analysis and artificial neural networks (ANNs). Wheat flour was used for laboratory tests.
PL
Przemysł zbożowo-młynarski zajmuje się przemiałem zboża na mąkę i kasze. Procesy te odbywają się w młynach. W czasie procesu technologicznego produkcji mąki oraz kasz, może dojść do zanieczyszczeń, co powoduje obniżenie jakości produktów końcowych. Przed wprowadzeniem produktu do obiegu konsumpcyjnego, mąki i kasze poddawane są analizie laboratoryjnej, między innymi pod względem czystości produktu. Analiza ta polega na organoleptycznym określeniu za pomocą zmysłu wzroku ilości zanieczyszczeń w mące i przetworach zbożowych. W artykule przedstawiono innowacyjne techniki oceny jakości poziomu zanieczyszczeń wykorzystujące analizę obrazu oraz sztuczne sieci neuronowe (SSN). Do badań laboratoryjnych wykorzystano mąkę pszenną.
2
Content available Archipelag sztucznej inteligencji. Część II
PL
W poprzednim numerze miesięcznika „Napędy i Sterowanie” zdefiniowałem, czym w istocie jest sztuczna inteligencja, oraz wyjaśniłem, dlaczego sztuczną inteligencję porównuję do archipelagu wysp. Dodatkowo w tym poprzednim artykule omówiłem już trzy wyspy tego archipelagu. Te trzy już omówione wyspy to kolejno: metody symboliczne, sieci neuronowe i systemy ekspertowe.
EN
The paper describes the possibility of using, building, and implementing an image recognition system in a company performing remanufacturing processes. It is based on a thesis prepared with the help of Wabco Reman Solutions. The tests were conducted using one of the parts remanufactured by the company – a manifold. The research focuses on different variants of the obtained image recognition models in order to identify differences that may affect their effectiveness and possible application in real work conditions. The environment used to build the models is Jupyter Notebook, and convolutional neural networks were implemented.
PL
W artykule opisano możliwości wykorzystania, budowy i wdrożenia systemu rozpoznawania obrazu w firmie realizującej proces regeneracji. Artykuł powstał na podstawie pracy magisterskiej przygotowanej przy pomocy Wabco Reman Solutions. Przeprowadzone testy zostały wykonane na jednej z regenerowanych części w firmie - kolektorze. W badaniach skupiono się na różnych wariantach powstałych modeli rozpoznawania obrazów w celu dostrzeżenia różnic, które mogą wpłynąć na ich skuteczność i możliwość zastosowania w rzeczywistych warunkach pracy. Do budowy modeli, w których zaimplementowano konwolucyjne sieci neuronowe, wykorzystano środowisko Jupyter Notebook.
PL
W artykule przedstawiono analizę wybranych algorytmów śledzenia obiektów na bazie obrazu video. Śledzenie obiektów ma szereg zastosowań, takie jak monitoring, w interakcjach człowieka z komputerem, sterowanie pojazdami i robotami. Przedstawione tutaj algorytmy zostały wybrane ze względu na zdolność działania w czasie rzeczywistym i nie wymagających uzyskiwania informacji z przyszłych klatek filmu video. Analiza ich efektywności została przeprowadzona dla dwóch filmów video. Efektywność śledzenia w danej chwili czasu określana jest indeksem nakładania się obrazów Jaccarda, liczbą analizowanych klatek filmu na sekundę i poprawnością śledzenia. Wyniki obliczeń dla wszystkich analizowanych algorytmów przedstawiono na wykresach i w tabelach.
EN
The article presents an analysis of selected object tracking algorithms based on a video image. The importance of object tracking is reflected in a wide range of applications, such as monitoring, in human-computer interactions as well as vehicle and robot control. These algorithms were selected taking into account the ability to operate in real time, not requiring obtaining information from future frames of the video. The analysis was carried out for two video films. The tracking efficiency at a given time is determined by the Jaccard index Intersection-over-Union (IoU), number of analyzed frames per second and tracking correction. The calculation results for all analyzed algorithms are depicted on the appropriate figures and comparative tables.
5
EN
The identity of a language being spoken has been tackled over the years via statistical models on audio samples. A drawback of these approaches is the unavailability of phonetically transcribed data for all languages. This work proposes an approach based on image classification that utilized image representations of audio samples. Our model used Neural Networks and deep learning algorithms to analyse and classify three languages. The input to our network is a Spectrogram that was processed through the networks to extract local visual and temporal features for language prediction. From the model, we achieved 95.56 % accuracy on the test samples from the 3 languages.
EN
Augmented reality (AR) is a modern technology which integrates 3D virtual objects into the real environment in real time. It can be used for many purposes, which should improve different processes in daily life. The paper will analyze the areas in which this technology is currently used. First, the history of the development of augmented reality will be recalled. Then, this technology will be compared to virtual reality because these terms are often incorrectly used interchangeably. This paper describes the tools and popular platform solutions related to augmented reality. The most common problems related to the use of this technology will be discussed, including popular approaches concerning optical and video combining methods. The existing applications and their potential in solving everyday problems will be analyzed. Finally, the perspectives for the development of augmented reality and its possibilities in the future will be discussed. This paper provides a starting point for using and learning about augmented reality for everyone.
EN
This article describes the architecture of the Hamming-Lippmann neural network and the math of the modified learning-recognition algorithm and presents some practical aspects for using it for solving an image recognition task. We have created software using C# programming language, that utilized this network as an additional error-correcting procedure, and have solved the task of recognition highly corrupted QR codes (with a connection to the database). Experimental results, of finding the optimal parameters for this algorithm, are presented. This neural network doesn’t require time-consuming computational procedures and large amounts of memory, even for high-resolution and big size images.
PL
W tym artykule opisano architekturę sieci neuronowej Hamminga-Lippmanna oraz matematykę zmodyfikowanego algorytmu rozpoznawania uczenia się, a także przedstawiono kilka praktycznych aspektów korzystania z niej w celu rozwiązania zadania rozpoznawania obrazu. Stworzyliśmy oprogramowanie wykorzystujące język programowania C #, który wykorzystał tę sieć jako dodatkową procedurę korekty błędów i rozwiązaliśmy zadanie rozpoznawania wysoce uszkodzonych kodów QR (w połączeniu z bazą danych). Przedstawiono wyniki eksperymentalne poszukiwania optymalnych parametrów dla tego algorytmu. Opisywana neuronowa nie wymaga czasochłonnych procedur obliczeniowych i dużej ilości pamięci, nawet w przypadku obrazów o wysokiej rozdzielczości i dużych rozmiarach.
PL
W artykule przedstawiona została propozycja wykorzystania inżynierskich technik akwizycji danych i metod głębokiego uczenia do obiektywnej analizy obrazów tworzonych w trakcie wywiadu przez pacjentów z zaburzeniami neurodegeneracyjnymi.
EN
The article presents a proposal of using engineering data acquisition techniques and deep learning methods for an objective analysis of images created during the history-taking in patients with neurodegenerative disorders.
PL
Ten dwuczęściowy artykuł przedstawia interfejs do Narodowej Platformy Cyberbezpieczeństwa (NPC). Wykorzystuje on gesty i komendy wydawane głosem do sterowania pracą platformy. Ta część artykułu przedstawia strukturę interfejsu oraz sposób jego działania, ponadto prezentuje zagadnienia związane z jego implementacją. Do specyfikacji interfejsu wykorzystano podejście oparte na agentach upostaciowionych, wykazując że podejście to może być stosowane do tworzenia nie tylko systemów robotycznych, do czego było wykorzystywane wielokrotnie uprzednio. Aby dostosować to podejście do agentów, które działają na pograniczu środowiska fizycznego i cyberprzestrzeni, należało ekran monitora potraktować jako część środowiska, natomiast okienka i kursory potraktować jako elementy agentów. W konsekwencji uzyskano bardzo przejrzystą strukturę projektowanego systemu. Część druga tego artykułu przedstawia algorytmy wykorzystane do rozpoznawania mowy i mówców oraz gestów, a także rezultaty testów tych algorytmów.
EN
This two part paper presents an interface to the National Cybersecurity Platform utilising gestures and voice commands as the means of interaction between the operator and the platform. Cyberspace and its underlying infrastructure are vulnerable to a broad range of risk stemming from diverse cyber-threats. The main role of this interface is to support security analysts and operators controlling visualisation of cyberspace events like incidents or cyber-attacks especially when manipulating graphical information. Main visualization control modalities are gesture- and voice-based commands. Thus the design of gesture recognition and speech-recognition modules is provided. The speech module is also responsible for speaker identification in order to limit the access to trusted users only, registered with the visualisation control system. This part of the paper focuses on the structure and the activities of the interface, while the second part concentrates on the algorithms employed for the recognition of: gestures, voice commands and speakers.
PL
Ten dwuczęściowy artykuł przedstawia interfejs do Narodowej Platformy Cyberbezpieczeństwa (NPC). Wykorzystuje on gesty i komendy wydawane głosem do sterowania pracą platformy. Ta część artykułu przedstawia strukturę interfejsu oraz sposób jego działania, ponadto prezentuje zagadnienia związane z jego implementacją. Do specyfikacji interfejsu wykorzystano podejście oparte na agentach upostaciowionych, wykazując że podejście to może być stosowane do tworzenia nie tylko systemów robotycznych, do czego było wykorzystywane wielokrotnie uprzednio. Aby dostosować to podejście do agentów, które działają na pograniczu środowiska fizycznego i cyberprzestrzeni, należało ekran monitora potraktować jako część środowiska, natomiast okienka i kursory potraktować jako elementy agentów. W konsekwencji uzyskano bardzo przejrzystą strukturę projektowanego systemu. Część druga tego artykułu przedstawia algorytmy wykorzystane do rozpoznawania mowy i mówców oraz gestów, a także rezultaty testów tych algorytmów.
EN
This two part paper presents an interface to the National Cybersecurity Platform utilising gestures and voice commands as the means of interaction between the operator and the platform. Cyberspace and its underlying infrastructure are vulnerable to a broad range of risk stemming from diverse cyber-threats. The main role of this interface is to support security analysts and operators controlling visualisation of cyberspace events like incidents or cyber-attacks especially when manipulating graphical information. Main visualization control modalities are gesture- and voice-based commands. Thus the design of gesture recognition and speech-recognition modules is provided. The speech module is also responsible for speaker identification in order to limit the access to trusted users only, registered with the visualisation control system. This part of the paper focuses on the structure and the activities of the interface, while the second part concentrates on the algorithms employed for the recognition of: gestures, voice commands and speakers.
PL
W artykule przedstawiono cechy charakterystyczne płomienia powstającego w wyniku spalania paliw gazowych możliwe do zaobserwowania na jego obrazach zarejestrowanych za pomocą różnego rodzaju przetworników wizyjnych i termowizyjnych. Zaprezentowano uproszczony model obrazu płomienia, który jest podstawą oceny jakości spalania gazu na palnikach z płomieniem odkrytym w prowadzonych przez autora badaniach. Opisano wygląd płomienia dyfuzyjnego, kinetyczno-dyfuzyjnego oraz kinetycznego. Podano charakterystyczne cechy obrazów każdego z nich. Zaprezentowane modele odniesiono do równań stechiometrycznych spalania gazów węglowodorowych z użyciem tlenu. Przedstawiono przegląd przeprowadzonych eksperymentów, polegających na zarejestrowaniu obrazów płomienia z wykorzystaniem różnych rodzajów kamer, zarówno termowizyjnych, jak i wizyjnych, tzn. działających w świetle widzialnym. Użyte kamery wyposażone były w przetworniki pracujące w różnych technologiach. Zaprezentowane w artykule termogramy pochodziły z kamer: FLIR GF 320, z detektorem promieniowania podczerwonego typu InSb, FLIR A35, z detektorem typu mikrobolometr, oraz kamery NIT NATIVE WDR™, z detektorem typu CMOS (SWIR). Stosowane w badaniach kamery wizyjne wyposażone były w przetworniki typu CMOS, CCD. Zwrócono uwagę na problemy występujące podczas rejestracji obrazu płomienia, takie jak prześwietlenia, zbyt duży kontrast, rozmycia, utrata kształtu fotografowanego zjawiska. Przedstawiono parametry przetworników, które mogą wpływać na jakość otrzymywanych zdjęć. Zaprezentowano wyniki eksperymentu polegającego na użyciu cyfrowych algorytmów przetwarzania obrazu w celu zwiększenia na zdjęciu wynikowym jego rozdzielczości i rozpiętości tonalnej oraz osiąganej głębi kolorów (high dynamic range) z serii czterech jednoczesnych zdjęć płomienia. W końcowej części artykułu opisano wyniki eksperymentu polegającego na użyciu filtrów optycznych IR/UV cut i filtrów polaryzacyjnych w celu zmniejszenia prześwietleń i odbić, związanych z dużą jasnością fotografowanego zjawiska fizycznego. We wnioskach skomentowano wyniki przeprowadzonych eksperymentów oraz oceniono wykorzystywane rodzaje filtrów i przetworników zastosowanych kamer pod kątem przydatności do akwizycji obrazów płomieni palników odkrytych.
EN
This article presents the characteristic features of gas flame resulting from gas fuel combustion, which can be seen on its images, registered using various types of vision and thermovision sensors. A simplified model of the flame image is presented, which is the basis for assessing the quality of combustion process on open-flame burners, in the research conducted by the author. The appearance of diffusion, kinetic-diffusion and kinetic flames is described. The characteristic features of each of them are provided. The presented models were referred to stoichiometric equations for the combustion of hydrocarbon gases with oxygen. The paper presents a review of the experiments carried out, consisting of recording flame images using various types of thermal imaging and video cameras. The cameras used were equipped with sensors operating in different technologies. The thermograms presented in the article came from the following cameras: FLIR GF 320 with infrared radiation detector type InSb, FLIR A35 with a microbolometer type detector, and a NIT NATIVE WDR™ camera equipped with a CMOS detector (SWIR). The video cameras used in the tests were equipped with CMOS and CCD sensors. Attention was paid to problems occurring during flame image acquisition, such as overexposure, too much contrast, blurring, loss of the shape of the photographed phenomenon. The parameters of sensors which could affect the quality of the received images are presented. It presents the results of an experiment applying digital image processing algorithms used in order to increase its tonal range, contrast range and the achieved color depth of the final photograph (High Dynamic Range) from a series of four simultaneous flame images. The final part of the article describes the results of an experiment using IR/UV cut optical filter and polarizing filter to reduce the flashes and reflections associated with the high brightness of the photographed physical phenomenon. The conclusions comment on the results of the conducted experiments and the applied types of filters and sensors of the used cameras have been evaluated in terms of their suitability for acquiring images of flames of the open burners.
EN
The article presents the issues of using modern aerostats to increase the capabilities of image recognition and radiolocation systems, as well as data retransmission. A feature that differentiates airships from balloons is their own propulsion and rudders, thanks to which their flight can take place after a pre-planned route and long distances. Airships are divided into three classes; pressure (frameless), half-skeletal, and skeletal. The article recalls the concept of the stratospheric aerostat and also presents the aerostat of low altitudes made in this country, which is a continuator of the interwar reconnaissance system using the LECH airship. The aerostats presented in the article belong to the group of airships. Already in pre-war Poland, it was necessary to eliminate the military superiority of the western and eastern neighbours through the possibility of pre-emptive actions resulting from the possibility of recognizing the situation from the air at that time. Currently, the country is working on innovative solutions for modern aerostats. There is the possibility of implementing a stratospheric aerostat by Polish companies that are adapted to the specificity of geographical latitude, which is in the sphere of our interest in recognition and retransmission.
PL
Artykuł przedstawia problematykę wykorzystania współczesnych aerostatów w celu zwiększenia możliwości systemów rozpoznania obrazowego i radiolokacyjnego, a także retransmisji danych. Cechą różniącą sterowce od balonów jest posiadanie przez nie własnego napędu oraz sterów, dzięki czemu lot ich może odbywać się po z góry zaplanowanej trasie i na znaczne odległości. W artykule przypomniano koncepcję aerostatu stratosferycznego, a także przedstawiono wykonany w kraju aerostat małych wysokości będący kontynuatorem międzywojennego systemu rozpoznania wykorzystującego sterowiec ciśnieniowy LECH. Przedstawione w artykule aerostaty należą do grupy sterowców. Już w Polsce przedwojennej widziano konieczność niwelowania przewagi wojskowej zachodniego i wschodniego sąsiada poprzez możliwość działań wyprzedzają- cych wynikających z możliwości ówczesnego rozpoznania sytuacji z powietrza. Współcześnie w Polsce prowadzone są prace nad innowacyjnymi rozwiązaniami współczesnych aerostatów. Warto podkreślić, że przedsiębiorstwa krajowe mają możliwości opracowania i wykonywania aerostatów stratosferycznych dostosowanych do naszej szerokości geograficznej i różnych zadań związanych z rozpoznaniem i retransmisją.
PL
Celem artykułu jest porównanie dwóch metod rozpoznawania gatunków grzybów. W artykule zostały opisane dwie metody oparte na jednych z najpopularniejszych rozwiązań w dziedzinie image recognition, czyli Tensorflow oraz OpenCV. Do przeprowadzenia badań stworzono aplikację mobilną, w której obie metody zostały zaimplementowane oraz przetestowane. Dodatkowo aplikację wyposażono w mechanizmy ułatwiające zbieranie danych o aplikacji oraz algorytmach. Rezultaty badań wykazały, iż metoda oparta o Tensorflow o 9% skuteczniej rozpoznaje gatunki grzybów.
EN
The aim of the article is to compare two methods for identifying mushroom species. In article, two methods based on one of the most popular solutions in the field of image recognition, Tenosorflow and OpenCV, have been described. A research application was created to carry out the research, in which both algorithms were implemented and tested. In addition, the application was equipped with mechanisms facilitating the collection of application data and algorithms. The results of the research have show that the method based on Tensorflow by 9% more effectively recognizes mushroom species.
PL
W artykule opisano działanie systemu korekcyjnego dla wielkoformatowych projekcji oraz środowisko w jakim system pracuje. Przedstawiono jak zbudowane jest środowisko testowe oraz w jaki sposób środowisko to jest symulowane, aby wykonywać testy programu bez dostępu do sprzętu. Omówiono zniekształcenia, z którymi system się spotyka oraz pokazuje w jaki sposób wykonywana jest ich korekta.
EN
The article describes the operation of the correction system for large-format projections and the environment in which the system works. It shows how the test environment is built and how the environment is simulated to perform program tests without access to hardware. Discussed are the distortions with which the system meets and shows how the correction is performed.
EN
Although the unimodal biometric recognition (such as face and palmprint) has higher convenience, its security is also relatively weak. The recognition accuracy is easy affected by many factors such as ambient light and recognition distance etc. To address this issue, we present a weighted multimodal biometric recognition algorithm with face and palmprint based on histogram of contourlet oriented gradient (HCOG) feature description. We employ the nonsubsampled contour transform (NSCT) to decompose the face and palmprint images, and the HOG method is adopted to extract the feature, which is named as HCOG feature. Then the dimension reduction process is applied on the HCOG feature and a novel weight value computation method is proposed to accomplish the multimodal biometric fusion recognition. Extensive experiments illustrate that our proposed weighted fusion recognition can achieve excellent recognition accuracy rates and outmatches the unimodal biometric recognition methods.
EN
Human Activity Recognition (HAR) is an important area of research in ambient intelligence for various contexts such as ambient-assisted living. The existing HAR approaches are mostly based either on vision, mobile or wearable sensors. In this paper, we propose a hybrid approach for HAR by combining three types of sensing technologies, namely: smartphone accelerometer, RGB cameras and ambient sensors. Acceleration and video streams are analyzed using multiclass Support Vector Machine (SVM) and Convolutional Neural Networks, respectively. Such an analysis is improved with the ambient sensing data to assign semantics to human activities using description logic rules. For integration, we design and implement a Framework to address human activity recognition pipeline from the data collection phase until activity recognition and visualization. The various use cases and performance evaluations of the proposed approach show clearly its utility and efficiency in several everyday scenarios.
EN
Due to the advances made in recent years, methods based on deep neural networks have been able to achieve a state-of-the-art performance in various computer vision problems. In some tasks, such as image recognition, neural-based approaches have even been able to surpass human performance. However, the benchmarks on which neural networks achieve these impressive results usually consist of fairly high quality data. On the other hand, in practical applications we are often faced with images of low quality, affected by factors such as low resolution, presence of noise or a small dynamic range. It is unclear how resilient deep neural networks are to the presence of such factors. In this paper we experimentally evaluate the impact of low resolution on the classification accuracy of several notable neural architectures of recent years. Furthermore, we examine the possibility of improving neural networks’ performance in the task of low resolution image recognition by applying super-resolution prior to classification. The results of our experiments indicate that contemporary neural architectures remain significantly affected by low image resolution. By applying super-resolution prior to classification we were able to alleviate this issue to a large extent as long as the resolution of the images did not decrease too severely. However, in the case of very low resolution images the classification accuracy remained considerably affected.
PL
Niniejsza praca dotyczy metod komputerowego wspomagania mających na celu zwiększenie skuteczność rozpoznania słabo widocznych objawów udaru niedokrwiennego mózgu na podstawie przetwarzania i analizy obrazów tomografii komputerowej. Efekty przetwarzania były ocenione i porównywane przy wykorzystaniu obiektywizowanej miary obliczeniowej. Ponadto przedstawiono algorytm automatycznej detekcji i rozpoznania podejrzanych zmian chorobowych na podstawie obrazów oraz z uwzględnieniem danych klinicznych.
EN
Presented work was aimed for developing methods supporting effective diagnosis of early ischemic stroke based on the processing and analysis of computer tomography images. The proposed algorithms were designed to improved recognition of hidden symptoms of early stroke, and automatic detection of suspected lesions with respect to clinical data. Image processing results were evaluated and compared by proposed objectified measures.
EN
The article proposes an algorithm for detection of orientation of acorns during scarification process. This task is necessary for proper cut off of a part of acorn. Described algorithm uses Harris corner detector for location of acorn's remain of style. The performed tests have shown that proposed method is characterized by a sufficient sensitivity value as a unit of efficiency. Its specificity and precision are also high.
PL
W artykule przedstawiono propozycję algorytmu detekcji orientacji żołędzi w procesie automatycznej skaryfikacji żołędzi. Określenie orientacji jest konieczne w celu właściwego wykonania odcięcia części nasiona. Opisany algorytm wykorzystuje detektor Harrisa do wykrywania korzenia zarodkowego. Przeprowadzone testy pokazały, że metoda cechuje się wystarczającą wartością czułości jako miary wydajności. Specyficzność oraz precyzja również są wysokie.
EN
The usage of real-valued, local descriptors in computer vision applications is ofen constrained by their large memory requirements and long matching time. Typical approaches to the reduction of their vectors map the descriptor space to the Hamming space in which the obtained binary strings can be efficiently stored and compared. In contrary to such techniques, the approach proposed in this paper does not require a data-driven binarisation process, but can be seen as an extension of the floating-point descriptor computation pipeline with a step that allows turning it into a binary descriptor. In this step, binary tests are performed on values determined for pixel blocks from the described image patch. In the paper, the proposed approach is described and applied to two popular real-valued descriptors, SIFT and SURF. The paper also contains a comparison of the approach with state-of-the-art binarisation techniques and popular binary descriptors. The results demonstrate that the proposed representation for real-valued descriptors outperforms other methods on four demanding benchmark image datasets.
first rewind previous Strona / 6 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.