Rapid development of Artificial Intelligence (AI) technologies in recent years has created new opportunities to address the growing challenges in the aviation industry. Machine learning and Deep Learning, particularly through Convolutional Neural Networks (CNNs), have advanced image recognition capabilities, enhancing inspection processes possibilities. This paper explores the integration of AI with drones to improve the precision, efficiency, and speed of inspections of airframe emphasizing the necessity of accurate equipment preparation and precise operational planning. The study demonstrates how AI algorithms can process high-resolution images and sensor data to identify and classify defects. The motivation for this paper is to address the critical need for more efficient inspection methods in aviation, driven by the industry's increasing demand for higher repair process throughput and stringent safety standards.
Szybki rozwój technologii sztucznej inteligencji (SI) w ostatnich latach stworzył nowe możliwości radzenia sobie z rosnącymi wyzwaniami w przemyśle lotniczym. Metody uczenia maszynowego i głębokiego uczenia, szczególnie za pomocą konwolucyjnych sieci neuronowych (CNN), poprawiły zdolności rozpoznawania obrazów, usprawniając możliwości procesów inspekcji. Niniejszy artykuł opisuje propozycję integracji SI z dronami i w celu poprawy precyzji, efektywności i szybkości inspekcji płatowców podkreślając konieczność dokładnego przygotowania sprzętu i precyzyjnego planowania operacji. Tekst omawia przetwarzanie obrazów wysokiej rozdzielczości i danych z czujników, identyfikując i klasyfikując uszkodzenia. Motywacją do omówienia danego tematu jest konieczność opracowania bardziej efektywnych metod inspekcji w lotnictwie, co wynika z rosnącego zapotrzebowania na większą przepustowość procesów napraw i rygorystyczne standardy bezpieczeństwa w branży.
The chapter discusses the foundations for the system to verify and recognize the art style. Such a system seems to be interesting for the first step of the painting fraud identification and following the possible path of the different style influence for the final shape of the masterpiece. The approach presents image recognition using convolutional neural networks. These networks, due to their structure resembling the sight apparatus, and due to their efficiency in the case of two-dimensional data, are very often used for image recognition. Style recognition in art is currently a hot topic in machine learning circles. Courtesy of museums and galleries, there are now many databases available on the web that can be used in scientific work. The classes on which the network was to be tested are styles in history that are associated by the layman with the subject of art. This group includes Renaissance, Baroque, Romanticism, Neoclassicism, Surrealism, Cubism, Art Nouveau, Abstract Expressionism, Pop Art, and Impressionism. These classes were described in the work in terms of parameters that could affect the learning of the neural network. The networks were tested to determine the best parameters for identifying artistic styles. Networks with changing filter values, stride, and pooling parameters, and by selecting various additional layers were tested. The most important parameter was overfitting, which had to be prevented. As a result, networks peaked at 40% in Top1 and 80% in Top3. For smaller data, this result was optimistic for further research in recognizing other parameters, as well as using networks that were previously taught specific characteristics of styles, such as frequently used motifs or colors.
Celem realizowanego projektu badawczo-rozwojowego jest opracowanie bezinwazyjnego systemu pozwalającego na okresowe monitorowanie szczelności gazociągów i ich otoczenia. Definiując obszar badań, który związany jest z rozległą terytorialnie siecią gazociągów przesyłowych, w projekcie przyjęto założenie, że zadanie będzie realizowane przez system składający się z podsystemu pomiarowego, którym będzie śmigłowiec załogowy z zamontowanym spektroradiometrem podczerwieni, oraz z podsystemu informatycznego, którym będzie serwer obliczeniowy z zainstalowanym oprogramowaniem do przetwarzania zarejestrowanych danych hiperspektralnych. Spektroradiometr podczerwieni wraz ze specjalistycznym oprogramowaniem do wykrywania metanu będą umieszczone na podwieszanej pod śmigłowcem platformie stabilizacyjnej. Z kolei podsystem naziemny będzie się składał m.in. z: modułu do zarządzania i przechowywania danych z nalotów inspekcyjnych, modułu do przetwarzania danych w zakresie detekcji metanu, modułu do przetwarzania danych w zakresie monitorowania innych zagrożeń potencjalnie występujących w rejonach gazociągów przesyłowych oraz modułu przeznaczonego do generowania raportów z inspekcji. Specjalnie na potrzeby projektu zostanie zbudowane stanowisko doświadczalne pozwalające na symulowanie nieszczelności gazociągu, co będzie niezbędne do przeprowadzenia badań weryfikacyjnych realizowanych przez platformę powietrzną.
The aim of the research and development project is to develop a non-invasive system to periodically monitor the integrity of gas pipelines and their surroundings. By defining the research area, which is related to the territorially extensive network of transmission gas pipelines, it has been assumed in the project that the task will be carried out by a system consisting of: measurement subsystem, which will be a manned helicopter with a mounted infrared spectroradiometer and information subsystem, which will be a computing server with installed software for processing the recorded hyperspectral data. The infrared spectroradiometer with specialized software for methane detection will be placed on a stabilization platform suspended under the helicopter. The ground subsystem will consist of: module for managing and storing data from inspection flights, module for processing data on methane detection, module for processing data on monitoring other hazards potentially occurring in the region of transmission pipelines and module for generating inspection reports. Especially for the project, an experimental stand will be built to simulate a gas pipeline leak, which will be necessary to carry out verification tests carried out by the air platform.
A new solar tracking sensor based on image recognition is proposed and designed to solve the problem of low accuracy of photoelectric tracking in photovoltaic power generation. The sensor can directly output its angular deviation from the sun, and its mechanical structure and working principle are analysed in detail. We use a high-precision camera to collect the image of the two slots on the projector surface and use the Hough transform to identify the image of the light seam. After obtaining the linear equation for the two slots, the coordinate of the intersection point is found, and the calculation of the solar altitude and azimuth can be realized. We have improved the Hough transform scheme by using the skeleton image of the slots instead of the edge image. The improvement of the scheme has been proved to effectively improve the detection accuracy. A calibration test board is used to test the sensor and experimental results show that the scheme can achieve the measurement of azimuth and altitude with the accuracy of be 0.05°, which can meet the detection accuracy requirements of the solar tracking in photovoltaic power generation and many other photoelectric tracking implementations.
Sorting coal and gangue is important in raw coal production; accurately identifying coal and gangue is a prerequisite for effectively separating coal and gangue. The method of extracting coal and gangue using image grayscale information can effectively identify coal and gangue, but the recognition rate of the sorting process based on image grayscale information needs to substantially higher than that which is needed to meet production requirements. A sorting method of coal and gangue using object surface grayscale-gloss characteristics is proposed to improve the recognition rate of coal and gangue. Using different comparative experiments, bituminous coal from the Huainan area was used as the experimental object. It was found that the number of pixel points corresponding to the highest level grey value of the grayscale moment and illumination component of the coal and gangue images were combined into a total discriminant value and used as input for the best classification of coal and gangue using the GWO-SVM classification model. The recognition rate could reach up to 98.14%. This method sorts coal and gangue by combining surface greyness and glossiness features, optimizes the traditional greyness-based recognition method, improves the recognition rate, makes the model generalizable, enriches the research on coal and gangue recognition, and has theoretical and practical significance in enterprise production operations.
Sortowanie węgla i skały płonnej jest ważne w produkcji węgla surowego; dokładna identyfikacja węgla i skały płonnej jest warunkiem wstępnym skutecznego oddzielenia tych surowców. Metoda rozdzielenia węgla i skały płonnej przy użyciu informacji w skali szarości obrazu może skutecznie identyfikować węgiel i skałę płonną, ale stopień rozpoznawania procesu sortowania w oparciu o te informacje być znacznie wyższy niż wymagany do spełnienia wymagań produkcyjnych. W artykule zaproponowano metodę sortowania węgla i skały płonnej wykorzystującą charakterystykę połysku i skali szarości powierzchni obiektu w celu poprawy szybkości rozpoznawania węgla i skały płonnej. W badaniach wykorzystano próbki węgla kamiennego z obszaru Huainan. Stwierdzono, że liczbę punktów pikseli odpowiadającą najwyższemu poziomowi szarości momentu w skali szarości i składowej oświetlenia obrazów węgla i skały płonnej połączono w całkowitą wartość dyskryminującą i wykorzystano jako dane wejściowe dla najlepszej klasyfikacji węgla i skały płonnej przy użyciu modelu klasyfikacji GWO-SVM. Wskaźnik rozpoznawalności może osiągnąć nawet 98,14%. Ta metoda sortowania węgla i skały płonnej poprzez połączenie cech szarości i połysku powierzchni, optymalizuje tradycyjną metodę rozpoznawania w oparciu o szarość, poprawia współczynnik rozpoznawania, umożliwia uogólnienie modelu, wzbogaca badania nad rozpoznawaniem węgla i skały płonnej, ma znaczenie teoretyczne i praktyczne w operacjach produkcyjnych przedsiębiorstwa.
W artykule zaprezentowano innowacyjny projekt pn. „Opracowanie autonomicznego systemu do zbierania i analizy danych wraz z aplikacją WEB do zarządzania i monitorowania zadań realizowanych w wielostanowiskowej stacji naprawczej samochodów”. Głównym elementem badań w ramach projektu było opracowanie modelu rozpoznawania obrazu, który stał się podstawą opracowania oprogramowania do rozpoznawania numerów rejestracyjnych pojazdów w ramach laboratoryjnego zestawu warsztatowego. Podczas badań wykazano znaczny potencjał rozwiązania, które otrzymano na podstawie prawidłowo zaplanowanych i wykonanych prac badawczych, walidacji wyników oraz realizacji wszystkich głównych i pobocznych celów badawczych.
The paper presents an innovative project entitled “Development of an autonomous sys-tem for data collection and analysis together with a WEB application for managing and monitoring tasks performed in a multi-station car repair station”. The main element of research within the project was to develop a model of image recognition, which became the basis for the development of software for recognition of vehicle registration numbers within a laboratory workshop set. During the research the significant potential of the solution was demonstrated, which was obtained on the basis of properly planned and executed research work, validation of the results and implementation of all main and side research objectives.
Rekonstrukcja i rozpoznawanie obrazów jest typowym problemem występującym w wielu systemach przetwarzania obrazów. Zagadnienie to można sformułować jako rozwiązanie problemu odwrotnego. W artykule zaprezentowano autorski model systemu uczenia maszynowego, który może być wykorzystany do rekonstrukcji i rozpoznawania obrazów na podstawie ich liniowych projekcji.
Image reconstruction and recognition is a common problem found in many image processing systems. This problem can be formulated as a solution to the inverse problem. The article presents the author's model of a machine learning system that can be used for the reconstruction and recognition of images based on their linear projections.
Content available remote Analysis of the state of the art on non-intrusive object-screening techniques
The paper is devoted to an analysis of the modern methods and techniques used for non-intrusive object screening. First, currently used technology and the principle of equipment operation are described. Next, the ways for improving the reliability and efficiency of the screening process and ways for its automation are indicated. Finally, a schematic of an automated screening system that uses additional sensors and implements AI-based analysis for automatic detection and distinguishing between legal, illegal and illicit items inside the object under inspection is proposed.
Artykuł poświecony jest analizie nowoczesnych metod i technik stosowanych w nieinwazyjnej detekcji obiektu. Omówione zostały obecnie używane metody detekcji, a następnie wskazano na możliwości poprawy efektywności i wiarygodności tych metod poprzez wprowadzenie automatyzacji procesów automatyzacji. W końcu pokazano schemat systemu automatycznej inspekcji, w którym wykorzystano dodatkowe czujniki oraz elementy sztucznej inteligencji, pozwalające na rozróżnianie legalnych i nielegalnych rzeczy w obiekcie poddanemu inspekcji.
Content available remote Rekonstrukcja zdjęć twarzy z wykorzystaniem systemu uczenia maszynowego
W pracy przedstawiono możliwości zastosowania autorskiego modelu systemu uczenia maszynowego do rekonstrukcji i rozpoznawania zniekształconych, względnie uszkodzonych wzorców, a w szczególności obrazów twarzy zakrytych częściowo maskami. Prezentowane rozważania nie stanowią końcowych rozwiązań na poziomie aplikacyjnym dla systemu przetwarzania obrazów. Należy je raczej traktować jako potwierdzenie zasady (proof-of-concept) i uzasadnienie dalszych badań nad wykorzystaniem systemów opartych na superpozycji wzorców.
The paper presents the possibilities for using a proprietary model of a machine learning system for the reconstruction and recognition of distorted or damaged patterns, in particular the images of faces partially covered with masks. The presented considerations do not constitute final solutions at the application level for an image processing system. Rather, they should be treated as a proof-of-concept and a justification for developing solutions using systems based on pattern superposition.
The grain and milling industry deals with the grinding of grain into flour and groats. These processes take place in mills. During the technological process of producing flour and groats, contamination may occur, which reduces the quality of end products. Before the product is introduced into the consumption cycle, the flours and groats are subjected to laboratory analysis, including in terms of product purity. This analysis is based on the organoleptic determination of the amount of contamination in flour and grain products using the sense of sight. The article presents innovative techniques for assessing the quality of the pollution level using image analysis and artificial neural networks (ANNs). Wheat flour was used for laboratory tests.
Przemysł zbożowo-młynarski zajmuje się przemiałem zboża na mąkę i kasze. Procesy te odbywają się w młynach. W czasie procesu technologicznego produkcji mąki oraz kasz, może dojść do zanieczyszczeń, co powoduje obniżenie jakości produktów końcowych. Przed wprowadzeniem produktu do obiegu konsumpcyjnego, mąki i kasze poddawane są analizie laboratoryjnej, między innymi pod względem czystości produktu. Analiza ta polega na organoleptycznym określeniu za pomocą zmysłu wzroku ilości zanieczyszczeń w mące i przetworach zbożowych. W artykule przedstawiono innowacyjne techniki oceny jakości poziomu zanieczyszczeń wykorzystujące analizę obrazu oraz sztuczne sieci neuronowe (SSN). Do badań laboratoryjnych wykorzystano mąkę pszenną.
Content available Archipelag sztucznej inteligencji. Część II
W poprzednim numerze miesięcznika „Napędy i Sterowanie” zdefiniowałem, czym w istocie jest sztuczna inteligencja, oraz wyjaśniłem, dlaczego sztuczną inteligencję porównuję do archipelagu wysp. Dodatkowo w tym poprzednim artykule omówiłem już trzy wyspy tego archipelagu. Te trzy już omówione wyspy to kolejno: metody symboliczne, sieci neuronowe i systemy ekspertowe.
The paper describes the possibility of using, building, and implementing an image recognition system in a company performing remanufacturing processes. It is based on a thesis prepared with the help of Wabco Reman Solutions. The tests were conducted using one of the parts remanufactured by the company – a manifold. The research focuses on different variants of the obtained image recognition models in order to identify differences that may affect their effectiveness and possible application in real work conditions. The environment used to build the models is Jupyter Notebook, and convolutional neural networks were implemented.
W artykule opisano możliwości wykorzystania, budowy i wdrożenia systemu rozpoznawania obrazu w firmie realizującej proces regeneracji. Artykuł powstał na podstawie pracy magisterskiej przygotowanej przy pomocy Wabco Reman Solutions. Przeprowadzone testy zostały wykonane na jednej z regenerowanych części w firmie - kolektorze. W badaniach skupiono się na różnych wariantach powstałych modeli rozpoznawania obrazów w celu dostrzeżenia różnic, które mogą wpłynąć na ich skuteczność i możliwość zastosowania w rzeczywistych warunkach pracy. Do budowy modeli, w których zaimplementowano konwolucyjne sieci neuronowe, wykorzystano środowisko Jupyter Notebook.
W artykule omówiono możliwość użycia sieci konwolucyjnej do klasyfikacji obrazu ucha człowieka, celem zbudowania systemu weryfikacji tożsamości. Sprawdzono także skuteczność aplikacji w zależności od architektury sieci neuronowej, jak również zbadano wpływ oświetlenia oraz piercingu na skuteczność działania algorytmu.
The article presents the possibility of obtaining an image of the convolutional network for the classification of the human outer ear for build identity verification system. The effectiveness of the application was also checked depending on the architecture of the neural network, as well as the influence of lighting and piercing on the effectiveness of the algorithm.
W artykule przedstawiono analizę wybranych algorytmów śledzenia obiektów na bazie obrazu video. Śledzenie obiektów ma szereg zastosowań, takie jak monitoring, w interakcjach człowieka z komputerem, sterowanie pojazdami i robotami. Przedstawione tutaj algorytmy zostały wybrane ze względu na zdolność działania w czasie rzeczywistym i nie wymagających uzyskiwania informacji z przyszłych klatek filmu video. Analiza ich efektywności została przeprowadzona dla dwóch filmów video. Efektywność śledzenia w danej chwili czasu określana jest indeksem nakładania się obrazów Jaccarda, liczbą analizowanych klatek filmu na sekundę i poprawnością śledzenia. Wyniki obliczeń dla wszystkich analizowanych algorytmów przedstawiono na wykresach i w tabelach.
The article presents an analysis of selected object tracking algorithms based on a video image. The importance of object tracking is reflected in a wide range of applications, such as monitoring, in human-computer interactions as well as vehicle and robot control. These algorithms were selected taking into account the ability to operate in real time, not requiring obtaining information from future frames of the video. The analysis was carried out for two video films. The tracking efficiency at a given time is determined by the Jaccard index Intersection-over-Union (IoU), number of analyzed frames per second and tracking correction. The calculation results for all analyzed algorithms are depicted on the appropriate figures and comparative tables.
The identity of a language being spoken has been tackled over the years via statistical models on audio samples. A drawback of these approaches is the unavailability of phonetically transcribed data for all languages. This work proposes an approach based on image classification that utilized image representations of audio samples. Our model used Neural Networks and deep learning algorithms to analyse and classify three languages. The input to our network is a Spectrogram that was processed through the networks to extract local visual and temporal features for language prediction. From the model, we achieved 95.56 % accuracy on the test samples from the 3 languages.
Content available remote A Social Robot-based Platform towards Automated Diet Tracking
Diet tracking via self-reports or manual taking of meal photos might be difficult, time-consuming, and discouraging, especially for children, which limits the potential of long-term dietary assessment. We present the design and development of a proof of concept of an automated and unobtrusive system for diet tracking integrating: a) a social robot programmed to automatically capture photos of food and motivate children, b) a deep learning model based on Google Inception V3, applied for the use case of image-based fruit recognition, c) a RESTful microservice architecture deployed to deliver the model outcomes to a platform aiming at childhood obesity prevention. We illustrate the feasibility and virtue of this approach, towards the development of the next-generation computer-assisted systems for automated diet tracking.
Augmented reality (AR) is a modern technology which integrates 3D virtual objects into the real environment in real time. It can be used for many purposes, which should improve different processes in daily life. The paper will analyze the areas in which this technology is currently used. First, the history of the development of augmented reality will be recalled. Then, this technology will be compared to virtual reality because these terms are often incorrectly used interchangeably. This paper describes the tools and popular platform solutions related to augmented reality. The most common problems related to the use of this technology will be discussed, including popular approaches concerning optical and video combining methods. The existing applications and their potential in solving everyday problems will be analyzed. Finally, the perspectives for the development of augmented reality and its possibilities in the future will be discussed. This paper provides a starting point for using and learning about augmented reality for everyone.
This article describes the architecture of the Hamming-Lippmann neural network and the math of the modified learning-recognition algorithm and presents some practical aspects for using it for solving an image recognition task. We have created software using C# programming language, that utilized this network as an additional error-correcting procedure, and have solved the task of recognition highly corrupted QR codes (with a connection to the database). Experimental results, of finding the optimal parameters for this algorithm, are presented. This neural network doesn’t require time-consuming computational procedures and large amounts of memory, even for high-resolution and big size images.
W tym artykule opisano architekturę sieci neuronowej Hamminga-Lippmanna oraz matematykę zmodyfikowanego algorytmu rozpoznawania uczenia się, a także przedstawiono kilka praktycznych aspektów korzystania z niej w celu rozwiązania zadania rozpoznawania obrazu. Stworzyliśmy oprogramowanie wykorzystujące język programowania C #, który wykorzystał tę sieć jako dodatkową procedurę korekty błędów i rozwiązaliśmy zadanie rozpoznawania wysoce uszkodzonych kodów QR (w połączeniu z bazą danych). Przedstawiono wyniki eksperymentalne poszukiwania optymalnych parametrów dla tego algorytmu. Opisywana neuronowa nie wymaga czasochłonnych procedur obliczeniowych i dużej ilości pamięci, nawet w przypadku obrazów o wysokiej rozdzielczości i dużych rozmiarach.
W artykule przedstawiona została propozycja wykorzystania inżynierskich technik akwizycji danych i metod głębokiego uczenia do obiektywnej analizy obrazów tworzonych w trakcie wywiadu przez pacjentów z zaburzeniami neurodegeneracyjnymi.
The article presents a proposal of using engineering data acquisition techniques and deep learning methods for an objective analysis of images created during the history-taking in patients with neurodegenerative disorders.
Ten dwuczęściowy artykuł przedstawia interfejs do Narodowej Platformy Cyberbezpieczeństwa (NPC). Wykorzystuje on gesty i komendy wydawane głosem do sterowania pracą platformy. Ta część artykułu przedstawia strukturę interfejsu oraz sposób jego działania, ponadto prezentuje zagadnienia związane z jego implementacją. Do specyfikacji interfejsu wykorzystano podejście oparte na agentach upostaciowionych, wykazując że podejście to może być stosowane do tworzenia nie tylko systemów robotycznych, do czego było wykorzystywane wielokrotnie uprzednio. Aby dostosować to podejście do agentów, które działają na pograniczu środowiska fizycznego i cyberprzestrzeni, należało ekran monitora potraktować jako część środowiska, natomiast okienka i kursory potraktować jako elementy agentów. W konsekwencji uzyskano bardzo przejrzystą strukturę projektowanego systemu. Część druga tego artykułu przedstawia algorytmy wykorzystane do rozpoznawania mowy i mówców oraz gestów, a także rezultaty testów tych algorytmów.
This two part paper presents an interface to the National Cybersecurity Platform utilising gestures and voice commands as the means of interaction between the operator and the platform. Cyberspace and its underlying infrastructure are vulnerable to a broad range of risk stemming from diverse cyber-threats. The main role of this interface is to support security analysts and operators controlling visualisation of cyberspace events like incidents or cyber-attacks especially when manipulating graphical information. Main visualization control modalities are gesture- and voice-based commands. Thus the design of gesture recognition and speech-recognition modules is provided. The speech module is also responsible for speaker identification in order to limit the access to trusted users only, registered with the visualisation control system. This part of the paper focuses on the structure and the activities of the interface, while the second part concentrates on the algorithms employed for the recognition of: gestures, voice commands and speakers.
