Koncepcja opisywanych badan opierała się na wyborze kilku reprezentacji, które następnie korelowano przy pomocy metod klasycznych i neuronowych. W trakcie badań przetestowano metody klasyczne spasowania obrazów i porównano je z powstałymi w trakcie badan metodami neuronowymi. Przeprowadzono równie_ eksperymenty polegające na pomiarach manualnych, wykonanych przez niezależnych obserwatorów. Istota metodyki opartej o sieci neuronowe polegała na przygotowaniu odpowiednich reprezentacji fragmentów obrazów i zastosowaniu do ich klasyfikacji różnych typów sieci neuronowych. Jedna z przyjętych metod bazowała na rozkładzie wartości modułu gradientu obrazu oraz jego kierunku. Sprawdzono przydatność tej reprezentacji do selekcji podobrazów przy pomocy sieci neuronowej SOM Kohonena. Druga metoda polegała na wykorzystaniu transformaty log-polar i log Hough’a, które są uważane za uproszczone modele przetwarzania wstępnego, realizowanego przez systemy wzrokowe ludzi i zwierząt. Przydatność tej i następnej reprezentacji badano przy pomocy sieci neuronowej typu backpropagation. Do utworzenia trzeciej reprezentacji zastosowano siec ICM (Intersecting Cortical Model), która jest jedną z wersji PCNN (Pulse Coupled Neural Network). Przy pomocy tej sieci wygenerowano tzw. podpisy obrazów (signatures), czyli kilkudziesięcioelementowe wektory, opisujące strukturę obrazu.
EN
The concept of the research was based on the selection of several representations, which were later correlated by means of conventional, and neural methods. In the course of research, conventional methods of image matching were tested and compared with neural methods that originating from the research process. Additionally, experiments consisting in manual measurements, performed by independent observers, were conducted. The essence of methodology that was based on neural networks consisted in the preparation of suitable representations of image fragments and using them for the classification of various types of neural networks. One of the assumed methods was based on the distribution of image gradient module value and of its direction. The usability of that representation for the selection of sub-images was tested by means of SOM Kohonen neural network. Another method consisted in the utilisation of the log-polar and log-Hough transforms, which are considered to be simplified models of preliminary image processing, performed by visual systems of people and animals. The usability of that representation was tested by means of the backpropagation type of neural network. As regards the generation of the third representation, the ICM (Intersecting Cortical Model) network was applied, which is one of the versions of the PCNN (Pulse Coupled Neural Network). Using that network, the so-called image signatures, or vectors composed of tens of elements which describe the image structure, were generated.
Problematyka dopasowania obrazów (spasowania, łączenia, matchingu) jest przedmiotem badan w wielu dziedzinach nauki. W celu rozwiązania problemu znalezienia odpowiadających sobie punktów na parze zdjęć lotniczych opracowano różne algorytmy. W niniejszym artykule, autorzy podjęli próbę podsumowania wybranych metod oraz dokonali oceny skuteczności ich działania. Dokonano przeglądu i porównania kilku metod. Zaimplementowano i przetestowano metody SIFT, Harris oraz Hesjan bazując na podstawie wyliczeń na rzeczywistych obrazach zdjęć lotniczych. Testy wykonano na kilku stereogramach dla wybranych skal oraz zmienności terenu. Do oceny wykorzystano parametry takie jak: średnia paralaksa na modelu, ilość wykrytych (dopasowanych) punktów oraz ich rozmieszczenie na modelu. Wyniki badan wskazują na podobną skuteczność wszystkich metod zależna głównie od rodzaju zdjęcia (tekstury obrazu) i skali. Wyniki wskazują, _e metody automatyczne dają porównywalne rezultaty, jeśli chodzi o dokładność (średnia paralaksa), natomiast duże zróżnicowanie występuje z rozmieszczeniem punktów na obrazie. Autorzy pracują równie_ nad poprawieniem algorytmów, które wybierałyby punkty o mniejszej dokładności, ale za to w każdym z kluczowych miejsc modelu stereoskopowego (tzw. Rejonach Grubera). Wśród badanych metod automatycznych, biorąc pod uwagę paralakse i rozmieszczenia punktów, relatywnie najlepiej zachowuje się metoda SIFT (najwyższe oceny, jeśli chodzi o rozmieszczenie punktów i stosunkowo dobre dokładności). Przy założonej jednakowej ilości punktów do orientacji (36) stosunkowo dobrze wypadała metoda Hesjan. Zwraca uwagę fakt, że wybrane metody na różnych obrazach prezentują różne dokładności, co może świadczyć o tym, że są czułe na „teksturę” obrazu.
EN
The issue of images matching is a subject of research in many fields of science. The demand for systems of matching exists not only in photogrammetry. Various algorithms have been developed in order to solve the problem of finding corresponding points within a pair of aerial photos. In this paper, the authors made an attempt at recapitulating selected methods of image matching, and assessed their efficiency. Several methods were reviewed and compared. The SIFT, the Harris, and the Hesse-Matrix methods were implemented and tested on the basis of calculations performed on actual aerial photos. The tests were made on several stereograms, in relation to selected scales and terrain changeability. During the assessment, the following parameters were applied: average parallax on a model, the number of detected (matched) points, as well as their distribution on a model. The test results proved similar efficiency of all methods, depending mainly on the photo type (image texture) and scale. The results show that the automatic methods yield comparable results, as far as their accuracy is concerned (the average parallax), whereas there is a high diversification as regards the distribution of points in the image.
W ramach prac prowadzonych w Zakładzie Fotogrametrii i Informatyki Teledetekcyjnej AGH, powstał algorytm dopasowania zdjęć lotniczych. Wykorzystuje on funkcje dostępnej biblioteki opensourcowej OpenCV służącej do przetwarzania obrazów. Algorytm aplikacji znajdującej punkty homologiczne na obrazach tworzących stereogram, wykorzystuje bibliotekę „OpenCV”. Działanie algorytmu polega na wyznaczaniu na pewnej określonej części obrazu prawego, najlepszego dopasowania szablonu pobranego z obrazu lewego, przechodząc sukcesywnie przez kolejne poziomy piramidy obrazów lewego i prawego. Szablon ze zdjęcia lewego jest buforem, o określonym rozmiarze zależnym od poziomu piramidy, wokół punktu, który będziemy szukać na zdjęciu prawym. Część obrazu prawego, na którym dokonuje sie przeszukiwania jest wyznaczana jako bufor, o punkcie centralnym równym przewidywanemu położeniu punktu homologicznego na zdjęciu prawym. Określenie prawdopodobnego położenia szukanego punktu następuje na podstawie wartości przesunięcia między obrazami – jeżeli jest to pierwsza iteracja po poziomach piramidy, lub na podstawie położenia punktu z poprzedniego poziomu piramidy, gdy wartość współczynnika dopasowania jest większa od zadanego progu. Przeszukanie zaczyna sie od najmniejszego obrazu piramidy, czyli od najwyższego poziomu. Przechodzi kolejno na poziomy niżej i kończy sie na obrazie oryginalnym. Na każdym poziomie piramidy korelowane są poszczególne punkty, a wyniki są zapisywane do odpowiedniego wektora. Wartość współczynnika dopasowania decyduje o wielkości obszaru do przeszukania na zdjęciu prawym. Wartości przesunięć po osi x i y są na bieżąco aktualizowane dla punktów wykazujących wysoki współczynnik dopasowania (minimalizacja błędów).Określenie dopasowania danego szablonu na obszarze przeszukiwania polega na obliczeniu wartości funkcji dwuwymiarowej kowariancji (korelacji lub odległości) dla sygnałów dwuwymiarowych, jakimi są obrazy i przedstawieniu tego w postaci mapy dopasowania dla każdego położenia szablonu względem obszaru przeszukiwania. Określenie najlepszego dopasowania polega na znalezieniu maksymalnej wartości piksela na powstałej mapie i zwróceniu go jako szukany punkt. Celem podniesienia wydajności algorytmu dokonano testów oraz analizy doboru parametrów dopasowania obrazów. W trakcie badan ustalony został optymalny rozmiar szablonu, zbadano także zachowanie współczynnika dopasowania obrazów.
EN
One of the works conducted in the Department of Photogrammetry and Remote Sensing Informatics, University of Science and Technology, Kraków, Poland included the development of an algorithm for aerial images matching. The algorithm utilises the function of an available OpenCV opensource library, which is used to process images. The application algorithm, which finds homological points in images that form a stereogram, utilizes the OpenCV library. The operation of the algorithm consists in determining, in a particular part of the right image, the best template downloaded from the left image, by means of successive passing through the levels of the right and left image pyramids. The left image template is a buffer of a specific size, which depends on the pyramid level, around the point to be searched for in the right image. Part of the right image, in which the search is performed, is determined as a buffer whose central point is equivalent to the anticipated position of the homological point in the right image. The determination of the probable position of the point searched for is made based on the displacement value between images, provided that that this is the first iteration after the pyramid levels, or based on the point's position from the previous pyramid level, when the value of the matching coefficient is higher than the threshold set. The search starts from the smallest image of the pyramid, it is from the highest level. Then, it passes to lower levels, one after another, and ends in the original image. On each level of the pyramid, particular points are corrected, and results are ascribed to proper vectors. The value of a matching coefficient determines the size of the area in the right image to be searched through. The values of displacement along the x and y axes are updated on a current basis, with respect to points that demonstrate high matching coefficient (the minimisation of errors). The determination of a given template matching within the search area consists in calculating the value of a two-dimensional co-variance function (correlation or distance) for two-dimensional signals that the images are, and presenting them in a form of a matching map for each template position in relation to the search area. The determination of a best match consists in finding the maximum value of pixel on the map, and returning it as the point searched for. In order to improve the efficiency of the algorithm, tests were conducted along with the analysis of image matching parameters' selection. An optimum size of the template was determined in the course of research, and also the behaviour of the image matching coefficient was studied.
Zagadnienie spasowania obszarów na obrazach cyfrowych związane jest ściśle z wyznaczaniem punktów homologicznych. Poprawność ich identyfikacji wpływa zasadniczo na dokładność wyznaczania elementów orientacji zdjęć, na dokładność NMT i ortofotomapy. Metody spasowania obszarów są tematem wielu publikacji. Mimo to trudno znaleźć formalne teoretyczne podstawy, na których można budować lub weryfikować algorytmy. Autor podejmuje próbę sformalizowania pewnych zagadnień spasowania obszarów, podaje warunki istnienia punktów i obszarów homologicznych oraz przedstawia pewne formuły i warunki dla spasowania obszarów. Teoretyczne rozważania były podstawą do zbudowania algorytmu wyznaczania punktów wiążących. Jego zastosowanie przedstawiono na przykładzie stereogramu lotniczego.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.