Content available Airborne oblique imaging: towards the hybrid era
If the use of oblique aerial camera systems is steadily growing for 3D capture of urban areas, their combination with a LiDAR unit seems to have all the potential to lead the airborne mapping sector a step forward. To fully exploit the complementary sensor behaviour, a new perspective should be adopted that looks beyond the traditional data processing chains and extends them towards an hybrid data processing concept. Assisted tie point matching, integrated sensor orientation and augmented 3D reconstruction are the keystones of a rigorous hybrid workflow for hybrid sensors. They should all rely on a deep understanding of the different properties of active and passive 3D imaging, and of the uncertainty components in their measurements. The paper will focus on the most recent answers to these issues, that open new opportunities for boosting the quality of the geospatial products w.r.t completeness, geometric quality, object detection and processing efficiency.
Zastosowania ukośnych systemów kamer lotniczych stale rosną szczególnie w przypadku pozyskiwania danych 3D dla obszarów miejskich. Ich połączenie z jednostką skanującą LiDAR ma potencjał, by poprowadzić sektor mapowania z danych lotniczych o krok do przodu. Aby jednak w pełni wykorzystać komplementarne współdziałanie sensorów, należy przyjąć nową perspektywę, która wykracza poza tradycyjne formy opracowania danych i rozszerza je na koncepcję hybrydowego ich przetwarzania. Wspomagane dopasowanie punktów wiążących, zintegrowana orientacja sensorów i rozszerzona rekonstrukcja 3D to kluczowe elementy rygorystycznej hybrydowej metodyki przetwarzania zintegrowanych sensorów fotogrametrycznych. Polegać ona powinna na głębokim zrozumieniu różnych właściwości aktywnego i pasywnego obrazowania 3D oraz założeń niepewności pomiaru internowanych technologii. Tematem przewodnim artykułu są najnowsze odpowiedzi na te przedstawione problemy, które otwierają nowe możliwości poprawy jakości produktów geoprzestrzennych co do kompletności, jakości geometrycznej, wykrywania obiektów i wydajności przetwarzania danych w zintegrowanych systemach obrazowania ukośnego i skanowania laserowego.
Celem niniejszego artykułu było ukazanie możliwości tworzenia numerycznych modeli wysokościowych na podstawie pary satelitarnych zdjęć stereoskopowych. Zdjęcia obejmowały obszar centralnej Warszawy. Wyniki skontrolowano z modelem powstałym na podstawie lotniczego skanowania laserowego (LIDAR). Stereopara pochodziła z satelity o bardzo dużej rozdzielczości Pleiades, zaś dane LIDAR zostały pozyskane w ramach projektu ISOK. W eksperymencie analizowano wpływ parametrów gęstego dopasowania obrazów, liczby fotopunktów niezbędnej do poprawnej georeferencji scen satelitarnych wstępnie orientowanych współczynnikami RPC, oceniono dokładność względem modelu wysokościowego LIDAR z uwzględnieniem eliminacji błędów grubych oraz spowodowanych martwymi polami. Prace przeprowadzono w oprogramowaniu Trimble Inpho. Uzyskane wyniki potwierdziły możliwość zastosowania wyłącznie 2-3 fotopunktów na obszarze opracowania, aby uzyskać zadowalające wyniki orientacji, a dalej tworzonego modelu wysokościowego. W analizie dokładności modelu wysokościowego uzyskano wyniki na poziomie pojedynczego piksela. Dla terenów odkrytych przy 214 fotopunktach kontrolnych z danych LIDAR błąd wysokościowy RMS wyniósł 50 cm.
The aim of this work was to show the possibility of generating digital surface models on the basis of satellite stereo-pair. Test area of experiment was the central part of Warsaw. The results were compared with a DSM based on the airborne laser scanning (LIDAR). The stereo-pair was collected with very high resolution satellite system Pleiades and LIDAR data was acquired within the ISOK project. In the experiment: the influence of dense image matching the parameters was analysed, impact of control points on the correctness of scenes georeferencing pre-orientated with RPC coefficients was verified, the accuracy of DSM was assessed including outliers resulted in lower spatial resolution of satellite imagery and occluded areas. The experiment was processed in the Trimble Inpho software. The results confirmed the possibility of applying only 2-3 control points in order to obtain satisfactory results of scenes orientation and consequently DSM accuracy. In the analysis of elevation models their accuracy at the level of a single ground sample distance was achieved. For uncovered areas in case of 214 LIDAR-based control points vertical RMS was 50 cm.
Lotnicze zdjęcia ukośne stają się coraz popularniejszym źródłem danych fotogrametrycznych, a liczba zamawiających je miast rośnie również w Polsce. Tego typu zobrazowania dostarczają znacznie więcej informacji niż typowe zdjęcia pionowe, ponadto wielu użytkowników postrzega je jako „bardziej naturalne”. Rosnące zainteresowanie takimi danymi widoczne jest również na poziomie urzędów centralnych odpowiedzialnych za tworzenie opracowań kartograficznych w wielu państwach europejskich. Zdjęcia ukośne przez lata postrzegane były jako dane uzupełniające do lotniczego skaningu laserowego (ALS), uzupełnianie to ograniczało się w wielu wypadkach jedynie do wykorzystania zdjęć jako źródła tekstur dla modeli 3D powstających z danych ALS. Innym popularnym obszarem zastosowań było tworzenie przeglądarek zdjęć ukośnych, które w połączniu z Numerycznym Modelem Terenu pozwały na uproszczony pomiary wysokości obiektów na pojedynczym zdjęciu. Sytuacja ta zmienia się w ostatnich latach, gdy wraz z rozwojem technologii fotogrametrycznych możliwa stała się dokładna orientacja zdjęć ukośnych z wykorzystaniem automatycznej aerotriangulacji, a algorytmy służące do gęstego dopasowania obrazów przystosowane zostały do pracy z takimi danymi. Niniejszy artykuł z zawiera przegląd opublikowanych w ostatnich latach wyników orientacji bloków zdjęć ukośnych, w szczególności porównano wyniki testów dotyczących metod orientacji zdjęć ukośnych przeprowadzonych przez EuroSDR i ISPRS z wynikami badań prowadzonymi na innych polach testowych. Przeprowadzone badania eksperymentalne skupione były na dwóch głównych aspektach, pierwszym była ocena dokładności odwzorowania geometrii fasad budynków z wykorzystaniem gęstego dopasowania obrazów w przypadku bloku zdjęć ukośnych, w którym ze względu na małe pokrycia fasada odfotografowana jest jedynie na pojedynczym modelu. Drugim z poruszonych tematów badań była próba wykorzystania zdjęć ukośnych do wykrywania zmian w obrębie fasad budynków co nie jest możliwe z wykorzystaniem innych danych pozyskiwanych z pułapu lotniczego.
Oblique aerial images are becoming an increasingly popular source of photogrammetric data, and they are being acquired by more and more municipalities in Poland also. This type of imagery can provide much more information than typical vertical photographs, and many users actually see them as "more natural." The growing interest in such data is becoming apparent even at the level of national mapping agencies responsible for the development of cartographic materials in many European countries. For years, oblique photographs were perceived as supplementary data for aerial laser scanning (ALS). Often, their supplementary role was limited to providing a source of textures for 3D models developed from ALS data. They were also commonly applied in dedicated oblique images viewers, which in conjunction with a Digital Terrain Model enabled simplified height measurements of features on a single photograph. With the advancement of photogrammetric technologies in recent years, the situation has been changing, and it has become possible to accurately orientate oblique images using automatic aerotriangulation and to apply adapted dense image matching (DIM) algorithms to work with this kind of data. This paper overviews the results of orientation of blocks of oblique photographs that have been published in recent years, focusing in particular on benchmarking results obtained by EuroSDR and ISPRS for methods of orientating oblique images. The purpose of the performed experimental tests was to determine the capacity for mapping the geometry of building façades using dense image matching and for detecting changes in urban space using oblique photographs with respect to façades. The research was focused on two main issues, the first one concerning the assessment of accuracy and the second an attempt to apply oblique photographs to the detection of changes in building façades, which is not possible using any other aerial photogrammetric data.
W artykule przedstawiono metodę dopasowania chmur punktów do powierzchni na przykładzie zagadnienia konstrukcji danych uczących w algorytmie ASM w zastosowaniu do segmentacji danych tomograficznych dla potrzeb planowania leczenia radioterapeutycznego. Zaproponowany algorytm składa się z 3 etapów: generacji chmur punktów dla danych uczących, sztywnego dopasowania (rotacji, przesunięcia) z wykorzystaniem ICP oraz lokalnej korekty wyników. Cała metodologia została przetestowana, a skuteczność oceniona na podstawie odległości punktów charakterystycznych w danych po dopasowaniu.
This paper addresses a problem of automatic point clouds matching in context of training data construction in Active Shape Model algorithm. An algorithm was applied to CT data segmentation for radiotherapy planning. Proposed methodology consists of 3 steps: point clouds generation, rigid matching (rotation, translation) based on ICP and local corrections of points location. Algorithm was tested and validated using distance between points in data after matching.
Content available remote Algorithm for creating panoramic images based on Mean Square Error
W artykule autorzy przedstawili metodę dopasowania cyfrowych obrazów pozyskanych za pomocą aparatu cyfrowego. Metoda dopasowania opiera swoją zasadę działania na analizie porównawczej dwóch obrazów za pomocą popularnej miary jakości oceny obrazów cyfrowych jaką jest błąd średniokwadratowy. Zastosowany algorytm dopasowania obejmuje synchronizację obrazów zarówno w płaszczyźnie X i Y oraz dopasowanie związane z kątem obrotu między obrazami. Zaproponowany algorytm dopasowania można zastosować do wykonywania zdjęć panoramicznych.
In this paper the authors present a method of matching digital images recorded with a digital camera. The functioning principle of the proposed method is based on the comparison analysis of two images using a popular measure of digital image quality assessment, i.e. mean square error. The applied algorithm includes synchronization of images both in the X and Y planes as well as adjustment related to the angle of rotation between the images. The proposed matching algorithm can be used to create panoramic images.
Celem niniejszego opracowania było zbadanie właściwości chmur punktów tworzonych metodą dopasowania obrazów zdjęć lotniczych semi-global matching (SGM) i porównanie ich z chmurami punktów z lotniczego skanowania laserowego. Do badań wykorzystane zostały zdjęcia lotnicze oraz dane z lotniczego skanowania laserowego pozyskane w latach 20102013 na obszarze centrum Elbląga. Na podstawie wejściowego zbioru danych wygenerowano chmury punktów metodą SGM, które poddano następnie analizie. Otrzymane chmury punktów badano poprzez porównanie dokładności wysokościowej względem profilu pomierzonego w terenie, porównanie wizualne profili chmur punktów oraz porównanie wizualne wygenerowanych na podstawie chmur punktów modeli pokrycia terenu. Przeprowadzone badania pozwoliły na sformułowanie szeregu szczegółowych wniosków dotyczących jakości chmur punktów SGM w odniesieniu do różnych czynników. Sformułowane wnioski szczegółowe prowadzą do generalnego spostrzeżenia, że chmury punktów SGM są produktem mniej niezawodnym, bardziej nieprzewidywalnym i zależnym od większej liczby czynników niż chmury punktów LIDAR. Mimo to przy odpowiednich parametrach chmury punktów SGM mogą przewyższać dokładnościowo chmury punktów LIDAR, a także dostarczać bardziej szczegółowej informacji dotyczącej pokrycia terenu. Skłania to do wniosku, że chmury punktów SGM mają potencjał i warto rozwijać tę metodę generowania chmur punktów.
The aim of this study was to investigate the properties of point clouds derived from aerial image matching and to compare them with point clouds from airborne laser scanning. A set of aerial images acquired in years 2010-2013 over the city of Elblag were used for the analysis. Images were acquired with the use of three digital cameras: DMC II 230, DMC I and DigiCAM60 with a GSD varying from 4.5 cm to 15 cm. Eight sets of images that were used in the study were acquired at different stages of the growing season – from March to December. Two LiDAR point clouds were used for the comparison – one with a density of 1.3 p/m2 and a second with a density of 10 p/m2. Based on the input images point clouds were created with the use of the semi-global matching method. The properties of the obtained point clouds were analyzed in three ways: – by the comparison of the vertical accuracy of point clouds with reference to a terrain profile surveyed on bare ground with GPS-RTK method – by visual assessment of point cloud profiles generated both from SGM and LiDAR point clouds – by visual assessment of a digital surface model generated from a SGM point cloud with reference to a digital surface model generated from a LiDAR point cloud. The conducted studies allowed a number of observations about the quality of SGM point clouds to be formulated with respect to different factors. The main factors having influence on the quality of SGM point clouds are GSD and base/height ratio. The essential problem related to SGM point clouds are areas covered with vegetation where SGM point clouds are visibly worse in terms of both accuracy and the representation of terrain surface. It is difficult to expect that in these areas SGM point clouds could replace LiDAR point clouds. This leads to a general conclusion that SGM point clouds are less reliable, more unpredictable and are dependent on more factors than LiDAR point clouds. Nevertheless, SGM point clouds generated with appropriate parameters can have better accuracy than LiDAR point clouds and present more detailed information about the terrain surface.
Content available Algorytm automatycznego dopasowywania obrazów
W artykule autorzy przedstawili problem wynikający z niedokładnego dopasowania obrazów cyfrowych pochodzący z różnych źródeł. Został zaproponowany algorytm oparty na analizie współczynnika korelacji pozwalający dopasować dwa obrazy w miejscach ich wzajemnego podobieństwa.
In this paper the authors present a problem due to the inaccurate matching of digital images from different sources. Algorithm was proposed based on the analysis of the correlation coefficient allows two images to match the locations of their mutual similarities.
W pracy przedstawiono problematykę modelowania struktur anatomicznych zobrazowanych w danych tomograficznych na przykładzie pacjentów z nowotworem prostaty. Modele wiedzy a priori umożliwiają znaczące zwiększenie skuteczności segmentacji dla potrzeb planowania leczenia radioterapeutycznego pacjentów z chorobą nowotworową. Opisane i przebadane metody wykorzystywały informację o położeniu pacjenta zapisaną w formacie DICOM, transformację afiniczną oraz jednoczesne deformowalne dopasowanie wielu obrazów wykorzystujące funkcję B-sklejane. Metodologia została przetestowana na rzeczywistych danych tomograficznych. Otrzymane wyniki potwierdzają skuteczność zaprezentowanego rozwiązania z wykorzystaniem połączenia globalnej transformacji i deformowalnego modelowania.
In developed countries, prostate cancer is one of the most often tumors in male population. Radiotherapy is a very important treatment in prostate cancer therapy. The most important, difficult and time-consuming part of radiation therapy planning is precise, manual anatomical organ delineation by medical doctors. For this reason development of special, fast, data-robust, automatic or semi-automatic CT data segmentation methods is a crucial and challenging research topic in image-guided radiother-apy. In a solution of this kind a priori knowledge of segmentation algo-rithms can improve the effectiveness considerably. In the paper there is proposed a method for construction of a geometrical and value model of anatomical structures for prostate, bladder, femoral heads and rectum from the CT data making use of groupwise registration. A short state of the art of model building (Section 2) for medical images is shown. The main idea of the described method is average 3D image creation from training images using combination of an affine transform and B-Spline Free Form Deformation in the groupwise framework [17]. As a result, the algorithm provides 3D deformation fields which can be used for mapping manual outlines of anatomical structures connected to training data made by a medical doctor. The model was built using CT data of real patients with prostate cancer. Exemplary results are shown in Fig. 3. This kind of model can be used as a priori knowledge in segmentation algorithms like deformable models or level sets. The proposed solution was compared with the affine transform and mapping based on the patient position provided with CT images in DICOM format (Section 3) in a qualitative (Fig. 1) and quantitative (Tab. 1) way. The obtained results are presented and discussed in the paper.
This paper presents work on a PC-based software solution for evaluation of burn wounds, leading to automatic registration of infrared and visible light images. The algorithm of reference points detection, crucial for the registration procedure, is presented in details. Enhancements requested by the physicians are also outlined.
Artykuł prezentuje prace nad oprogramowaniem do oceny ran oparzeniowych, związane z automatycznym dopasowaniem zdjęć wykonanych w świetle podczerwonym i widzialnym. Algorytm wykrywania punktów odniesienia, kluczowy dla procedury dopasowania, jest opisany w szczegółach. Przedstawione zostały również inne udoskonalenia wykonane na życzenie lekarzy.
Dopasowanie obrazów jest jednym z etapów fuzji obrazów. W artykule zaprezentowano blokowy algorytm dopasowania obrazów multimodalnych, bazujący na korelacji fazowej. Algorytm wykorzystuje podział obrazu na prostokątne bloki w celu lepszego dopasowania kilku planów obserwowanej sceny. Rozwiązanie zostało opracowane dla systemu monitorowania złożonego z kamer IR oraz TV, przy wynikających stąd założeniach upraszczających.
Sophisticated video surveillance systems use many cameras for watching over the same area. Image fusion allows combining two or more images into a single image containing the most relevant information. One of the most important phases of image fusion is image registration. In this article, we present a block based image registration algorithm for multi-modal images, using the example of TV and thermal (IR) camera images acquired by a monitoring head. For this type of head, the proposed algorithm searches only for translation parameters to align both images; scale and rotation parameters are assumed to be constant, and distortion is neglected. The rough translation parameters are calculated by the classic phase correlation method for image registration. Then, the same method is used to vertically align corresponding rectangular blocks of both images. Inaccurate alignment parameters are detected by the analysis of these parameters in some antecedent time probes and adequately corrected. Data integration by filling gaps between image blocks constitutes the last phase of the presented algorithm. This algorithm delivers good registration effects for images with several near and distant planes of images and preserves a low computation complexity enabling real-time hardware implementation.
Artykuł prezentuje stan prac nad systemem fuzji obrazów z kamer IR i TV realizowanym w ramach projektu rozwojowego. Omówiona została koncepcja systemu, metodyka badań laboratoryjnych, wybór algorytmów oraz ich implementacja sprzętowa działająca w czasie rzeczywistym. System zrealizowany w pojedynczym układzie FPGA wyróżnia się wysoką elastycznością i bardzo oszczędnym wykorzystaniem układów mnożących i logicznych. Przedstawione rozwiązania mają charakter ogólny i mogą mieć zastosowanie w różnorodnych systemach nadzoru i diagnostyki.
The paper presents the state of research dealing with TV and thermal image fusion (Fig. 3) performed within the framework of national research and development project. There are presented main results of the project. Solutions found are evaluated as general and therefore, the spectrum of possible implementations of the system pass over primary assumptions. Typical application areas of the image fusion system concern supervisory and diagnostics systems. The idea of the system, the methodology of laboratory research with the use of prototype platform, designed for testing algorithms realized as C plugins (Fig. 1), and laboratory optoelectronic head (Fig. 2) are presented. The paper presents as well the investigations of algorithms promising real-time implementation. Finally, the phase correlation algorithm for image registration [8] as well as Laplacian pyramid algorithm for image fusion ([9], Fig. 4, 5) have been chosen for system of TV and thermal image fusion. System has been realized on a chip making use from single FPGA (Fig. 6). Presented system stands out from similar solutions [2-4] with high flexibility, facility of quick reconfiguration and very good economical factors.
W artykule przedstawiono fragment wyników badań dotyczących wyboru metody dopasowania obrazów dla potrzeb ich dalszej fuzji. Poszukiwano metody pozwalającej na efektywne dopasowanie obrazów wizyjnych i termowizyjnych przedstawiających scenę o strukturze zmieniającej się w czasie. Ocenę jakości dopasowania przeprowadzono z zastosowaniem wybranych metryk jakościowych. Porównywano ze sobą różne metody. Wyniki oceny wskazują, że algorytmem dopasowania prowadzącym do uzyskania obrazu po fuzji o najlepszej jakości jest algorytm wykorzystujący mapy gradientów.
In the paper the part of studies connected with search of an optimal image registration method suitable for further image fusion purposes is presented. The search was made for an infrared and visible light acquired image. Thermograms were taken by cameras working in mid (outdoor scene) and long infrared (welding arc). Degradation between images was connected mainly with translation between camera optical axes. Three registration methods were taken into consideration. They were based on cross correlation, maximization of mutual information as well as intensity and edge orientation information. Each method was used to register images from two sets. The aligned images were next aggregated with the multiscale discrete wavelet method. The registration quality was measured with objective quality metrics such as the root mean square error (RMSE), the peak signal to noise ratio (PSNR) and the universal image quality index (Q). The used metrics allow the comparison between the benchmark images registered manually and the considered images. The analysis of the obtained results leads to the statement that among the tested methods the one using simultaneously the area and feature information generates the best registration parameters. On the other hand, the practical usage of image fusion is strongly connected with amount of the time consumed for registration. Thus, the preregistration and assumption that only transitional differences between images are present influence the capability of each method applicability.
Reconstruction of three dimensional models of objects from images has been a long lasting research topic in photogrammetry and computer vision. The demand for 3D models is continuously increasing in such fields as cultural heritage, computer graphics, robotics and many others. The number and types of features of a 3D model are highly dependent on the use of the models, and can be very variable in terms of accuracy and time for their creation. In last years, both computer vision and photogrammetric communities have approached the reconstruction problems by using different methods to solve the same tasks, such as camera calibration, orientation, object reconstruction and modelling. The terminology which is used for addressing the particular task in both disciplines is sometimes diverse. On the other hand, the integration of methods and algorithms coming from them can be used to improve both. The image based modelling of an object has been defined as a complete process that starts with image acquisition and ends with an interactive 3D virtual model. The photogrammetric approach to create 3D models involves the followings steps: image pre-processing, camera calibration, orientation of images network, image scanning for point detection, surface measurement and point triangulation, blunder detection and statistical filtering, mesh generation and texturing, visualization and analysis. Currently there is no single software package available that allows for each of those steps to be executed within the same environment. For high accuracy of 3D objects reconstruction operators are required as a preliminary step in the surface measurement process, to find the features that serve as suitable points when matching across multiple images. Operators are the algorithms which detect the features of interest in an image, such as corners, edges or regions. This paper reports on the first phase of research on the generation of high accuracy 3D model measurement and modelling, focusing upon the application of different operators for accurate feature point extraction. The implementation of those operators is discussed and performance of differen operators is analysed. The optimal operator for high accuracy close range object reconstruction is then highlighted. This research has facilitated a development of the feature extraction and image measurement process that will be central to the development of an automatic procedure for high accuracy point cloud generation in multi image networks where robust orientation and 3D point determination will facilitate surface measurement and modelling within a single software system.
W artykule zaproponowano prosty, szybki i odporny algorytm dopasowania obrazów, który został zaprojektowany do fuzji obrazów realizowanej w czasie rzeczywistym. Algorytm zaprezentowano na tle znanych rozwiązań, dla których może stanowić interesującą alternatywę. Przyjęto, że dopasowanie dotyczyć będzie zwłaszcza obrazów pozyskiwanych synchronicznie przez kamery TV i IR. Omówiono wyniki testowania kilku wariantów prezentowanego algorytmu i przykłady zastosowań, w tym także w odniesieniu do robotyki.
Fast and simple as well as robust image alignment algorithm developed for real time image fusion has been described in this paper. Algorithm has to be considered as an interesting alternative solution compared to the known more complex solutions. It has been assumed, that image alignment will be suitable particularly for the synchronously acquired images by the TV and IR cameras. The results of the tests of several variants of presented algorithm has been given. Finally, the examples of applications particularly in the area of robotics has been shown.
W pracy przedstawiono algorytm stabilizacji obrazów badanego obiektu poprzez transformacje sekwencji obrazów zarejestrowanych w świetle widzialnym. Zaprezentowano koncepcję, w jaki sposób wykorzystać uzyskane dane transformacji do korekty i stabilizacji rejestrowanych synchronicznie sekwencji obrazów podczerwieni, w celu poprawy dokładności i efektywności metody aktywnej termografii dynamicznej (ADT). Procedura ta jest szczególnie istotna w badaniach termograficznych przy obserwacji bijącego serca w trakcie interwencji kardiochirurgicznych, ale generalnie pozwala na wyraźną poprawę jakości danych ADT w diagnostyce medycznej.
Algorithm of tested object visual image stabilization via transformation of image sequences is shown with the aim of image matching. A concept how to use the transformation data for correction and matching of IR-thermal images in active dynamic thermography (ADT) is presented. The procedure improves significantly accuracy and efficiency of ADT measurements. The method is especially important for observation of the beating heart during cardiosurgery interventions, but is of general use in ADT medical diagnostics.
Ortofotomapa jest obecnie najbardziej popularnym produktem kartograficznym. W obszarze zabudowanym obrazy budynków są jednak przesunięte zgodnie z rzutem środkowym, a część terenu jest zakryta (tzw. „martwe pola”). Tej wady nie ma „prawdziwe” orto (true-ortho). Do jego wykonania konieczny jest jednak numeryczny model pokrycia terenu (NMPT) z przestrzennymi modelami budynków. W artykule podjęto dyskusję uwarunkowań technicznych generowania trueortho. Rozważane są szczególne wymagania do wykonawstwa zdjęć lotniczych, generowania brył budynków z ręcznej stereodigitalizacji modelu zbudowanego ze zdjęć, z automatycznego dopasowania obrazów, oraz danych skaningu laserowego (LIDAR). Badany jest wpływ danych źródłowych na jakość wynikowego true-ortho, oraz koszt jego wytworzenia. Prezentowane są wstępne wyniki. Prace są kontynuowane.
Digital orthophotomap is at present the most popular cartographic product. However, in built-up areas, images of buildings are displaced according to the central projection, and part of the terrain is invisible (the so-called "occluded area"”). A true orthomap does not have such defects. The digital surface model (DSM) is however necessary, with spatial models of buildings to make it. The paper discusses technical aspects of the true-ortho generation. Special requirements relating to the execution of air photos are considered, along with the analysis of generating the building models based on the manual stereo digitalisation of the terrain model built on the basis of photos, automatic image matching, and laser data (LIDAR). The influence of source data on the quality of the outcome true-ortho, and the costs of its producing are reviewed. Preliminary results are presented. Works are continued.
Niniejszy artykuł prezentuje rezultaty badań uzyskane w zakresie budowy gęstego numerycznego modelu pokrycia terenu (NMPT) na podstawie chmury punktów generowanego przy pomocy programu Match-T DSM firmy INPHO. Do badań wykorzystano zdjęcia cyfrowe sporządzone kamerą Ultra Cam-D o pikselu terenowym 9 cm co pozwala przyjąć, że wyznaczone parametry jakościowe są reprezentatywne dla obszarów miejskich – zurbanizowanych. Określono istotne czynniki, które wpływają na przebieg automatycznego procesu korelacji. Finalnie na obiekcie eksperymentalnym uzyskano NMPT w strukturze GRID o rozmiarach 0.5 m wygenerowanej przeciętnie z ponad 30 punktów źródłowych przypadających na jedno oczko, wyznaczonych w procesie automatycznej korelacji zdjęć. Jakość geometryczną tak utworzonego produktu oceniono poprzez porównanie go z danymi pozyskanymi dla tego samego terenu techniką lotniczego skaningu laserowego (ALS). Utworzone wysokościowe modele różnicowe potwierdzają, że NMPT utworzony techniką automatycznej korelacji cyfrowych zdjęć lotniczych charakteryzuje się dokładnością wysokościową wyższą niż 0.20 m. Dodatkowo stwierdzono, że przy zastosowaniu większego pokrycia podłużnego i poprzecznego zdjęć następuje znaczne ograniczenie martwych pól (gdzie punkty NMPT nie są wyznaczane). Stosowanie stereogramów o zmiennym stosunku bazowym prowadzi do utworzenia NMPT o zróżnicowanej charakterystyce dokładnościowej. Przeprowadzone badania wskazują, że tworzenie gęstego NMPT drogą dopasowania obrazów zdjęć cyfrowych może być konkurencyjne do uzyskiwanego z lotniczego skaningu laserowego.
This paper presents the evaluation of very dense DSM received from point clouds generated with Match-T DSM software. The digital photographs were taken with an Ultra Cam-D camera. The received GSD of 10 cm can be representative for very dense urban areas. The main factors which had an influence on the matching process were determined. The final DSM with 0.5 metre grid points was generated from a very dense cloud of points (30 points for each grid point on average). To evaluate the quality of this product, the DSM from imagery matching was compared with DSM generated from LIDAR data. The differential elevation models have confirmed that the DSM from imagery matching has accuracy better than 0.20 m. In addition, it was observed that by using larger overlap between photographs in and between strips, the obscured areas are considerably limited. However, it was also found, that by using stereo-pairs with various base to flying height ratios, DSMs with different accuracy can be obtained. In conclusion, the research has confirmed that the dense DSM from imagery matching is competitive with that from LIDAR data.
Problematyka dopasowania obrazów (spasowania, łączenia, matchingu) jest przedmiotem badan w wielu dziedzinach nauki. W celu rozwiązania problemu znalezienia odpowiadających sobie punktów na parze zdjęć lotniczych opracowano różne algorytmy. W niniejszym artykule, autorzy podjęli próbę podsumowania wybranych metod oraz dokonali oceny skuteczności ich działania. Dokonano przeglądu i porównania kilku metod. Zaimplementowano i przetestowano metody SIFT, Harris oraz Hesjan bazując na podstawie wyliczeń na rzeczywistych obrazach zdjęć lotniczych. Testy wykonano na kilku stereogramach dla wybranych skal oraz zmienności terenu. Do oceny wykorzystano parametry takie jak: średnia paralaksa na modelu, ilość wykrytych (dopasowanych) punktów oraz ich rozmieszczenie na modelu. Wyniki badan wskazują na podobną skuteczność wszystkich metod zależna głównie od rodzaju zdjęcia (tekstury obrazu) i skali. Wyniki wskazują, _e metody automatyczne dają porównywalne rezultaty, jeśli chodzi o dokładność (średnia paralaksa), natomiast duże zróżnicowanie występuje z rozmieszczeniem punktów na obrazie. Autorzy pracują równie_ nad poprawieniem algorytmów, które wybierałyby punkty o mniejszej dokładności, ale za to w każdym z kluczowych miejsc modelu stereoskopowego (tzw. Rejonach Grubera). Wśród badanych metod automatycznych, biorąc pod uwagę paralakse i rozmieszczenia punktów, relatywnie najlepiej zachowuje się metoda SIFT (najwyższe oceny, jeśli chodzi o rozmieszczenie punktów i stosunkowo dobre dokładności). Przy założonej jednakowej ilości punktów do orientacji (36) stosunkowo dobrze wypadała metoda Hesjan. Zwraca uwagę fakt, że wybrane metody na różnych obrazach prezentują różne dokładności, co może świadczyć o tym, że są czułe na „teksturę” obrazu.
The issue of images matching is a subject of research in many fields of science. The demand for systems of matching exists not only in photogrammetry. Various algorithms have been developed in order to solve the problem of finding corresponding points within a pair of aerial photos. In this paper, the authors made an attempt at recapitulating selected methods of image matching, and assessed their efficiency. Several methods were reviewed and compared. The SIFT, the Harris, and the Hesse-Matrix methods were implemented and tested on the basis of calculations performed on actual aerial photos. The tests were made on several stereograms, in relation to selected scales and terrain changeability. During the assessment, the following parameters were applied: average parallax on a model, the number of detected (matched) points, as well as their distribution on a model. The test results proved similar efficiency of all methods, depending mainly on the photo type (image texture) and scale. The results show that the automatic methods yield comparable results, as far as their accuracy is concerned (the average parallax), whereas there is a high diversification as regards the distribution of points in the image.
W ramach prac prowadzonych w Zakładzie Fotogrametrii i Informatyki Teledetekcyjnej AGH, powstał algorytm dopasowania zdjęć lotniczych. Wykorzystuje on funkcje dostępnej biblioteki opensourcowej OpenCV służącej do przetwarzania obrazów. Algorytm aplikacji znajdującej punkty homologiczne na obrazach tworzących stereogram, wykorzystuje bibliotekę „OpenCV”. Działanie algorytmu polega na wyznaczaniu na pewnej określonej części obrazu prawego, najlepszego dopasowania szablonu pobranego z obrazu lewego, przechodząc sukcesywnie przez kolejne poziomy piramidy obrazów lewego i prawego. Szablon ze zdjęcia lewego jest buforem, o określonym rozmiarze zależnym od poziomu piramidy, wokół punktu, który będziemy szukać na zdjęciu prawym. Część obrazu prawego, na którym dokonuje sie przeszukiwania jest wyznaczana jako bufor, o punkcie centralnym równym przewidywanemu położeniu punktu homologicznego na zdjęciu prawym. Określenie prawdopodobnego położenia szukanego punktu następuje na podstawie wartości przesunięcia między obrazami – jeżeli jest to pierwsza iteracja po poziomach piramidy, lub na podstawie położenia punktu z poprzedniego poziomu piramidy, gdy wartość współczynnika dopasowania jest większa od zadanego progu. Przeszukanie zaczyna sie od najmniejszego obrazu piramidy, czyli od najwyższego poziomu. Przechodzi kolejno na poziomy niżej i kończy sie na obrazie oryginalnym. Na każdym poziomie piramidy korelowane są poszczególne punkty, a wyniki są zapisywane do odpowiedniego wektora. Wartość współczynnika dopasowania decyduje o wielkości obszaru do przeszukania na zdjęciu prawym. Wartości przesunięć po osi x i y są na bieżąco aktualizowane dla punktów wykazujących wysoki współczynnik dopasowania (minimalizacja błędów).Określenie dopasowania danego szablonu na obszarze przeszukiwania polega na obliczeniu wartości funkcji dwuwymiarowej kowariancji (korelacji lub odległości) dla sygnałów dwuwymiarowych, jakimi są obrazy i przedstawieniu tego w postaci mapy dopasowania dla każdego położenia szablonu względem obszaru przeszukiwania. Określenie najlepszego dopasowania polega na znalezieniu maksymalnej wartości piksela na powstałej mapie i zwróceniu go jako szukany punkt. Celem podniesienia wydajności algorytmu dokonano testów oraz analizy doboru parametrów dopasowania obrazów. W trakcie badan ustalony został optymalny rozmiar szablonu, zbadano także zachowanie współczynnika dopasowania obrazów.
One of the works conducted in the Department of Photogrammetry and Remote Sensing Informatics, University of Science and Technology, Kraków, Poland included the development of an algorithm for aerial images matching. The algorithm utilises the function of an available OpenCV opensource library, which is used to process images. The application algorithm, which finds homological points in images that form a stereogram, utilizes the OpenCV library. The operation of the algorithm consists in determining, in a particular part of the right image, the best template downloaded from the left image, by means of successive passing through the levels of the right and left image pyramids. The left image template is a buffer of a specific size, which depends on the pyramid level, around the point to be searched for in the right image. Part of the right image, in which the search is performed, is determined as a buffer whose central point is equivalent to the anticipated position of the homological point in the right image. The determination of the probable position of the point searched for is made based on the displacement value between images, provided that that this is the first iteration after the pyramid levels, or based on the point's position from the previous pyramid level, when the value of the matching coefficient is higher than the threshold set. The search starts from the smallest image of the pyramid, it is from the highest level. Then, it passes to lower levels, one after another, and ends in the original image. On each level of the pyramid, particular points are corrected, and results are ascribed to proper vectors. The value of a matching coefficient determines the size of the area in the right image to be searched through. The values of displacement along the x and y axes are updated on a current basis, with respect to points that demonstrate high matching coefficient (the minimisation of errors). The determination of a given template matching within the search area consists in calculating the value of a two-dimensional co-variance function (correlation or distance) for two-dimensional signals that the images are, and presenting them in a form of a matching map for each template position in relation to the search area. The determination of a best match consists in finding the maximum value of pixel on the map, and returning it as the point searched for. In order to improve the efficiency of the algorithm, tests were conducted along with the analysis of image matching parameters' selection. An optimum size of the template was determined in the course of research, and also the behaviour of the image matching coefficient was studied.
