Wybrane metody i narzędzia wydobywania informacji z obrazów histologicznych w zastosowaniu do wspomagania diagnostyki patomorfologicznej

Selected methods and tools for data mining of histological images in application to support of pathological diagnosis
W rozprawie przedstawiono wybrane aspekty zastosowań metod i narzędzi przetwarzania obrazów histologicznych do celów wspomagania diagnostyki patomorfologicznej. W szczególności rozważania dotyczą opracowania nowych algorytmów segmentacji obrazów barwnych opartych na morfologii matematycznej i sztucznych sieciach neuronowych typu Support Vector Machine (SVM), pełniących zarówno rolę klasyfikatora rozpoznawanych obiektów, jak i deskryptora wspomagającego ich wydzielanie z obrazu. W ramach badań została stworzona bardzo obszerna baza danych obrazów mikroskopowych tkanek ludzkich zmienionych patologicznie. Rozważane było pięć różnych rodzajów nowotworów (trzy nowotwory ośrodkowego układu nerwowego, raki sutka i rak skóry), zmiany zapalne w obrębie górnego odcinka przewodu pokarmowego (zapalenia żołądka) oraz ocena stopnia angiogenezy szpiku kostnego. Analizowanych było po kilkadziesiąt preparatów wymienionych zmian w różnych odczynach i barwieniach znacznikowych, na podstawie ich obrazów cyfrowych. Proponowane metody zostały przetestowane na rzeczywistych obrazach medycznych, których liczebność pozwala na rzetelną ocenę skuteczności proponowanych procedur ich przetwarzania. Głównym zadaniem było opracowanie automatycznego systemu komputerowego pozwalającego na analizę ilościową obrazów histologicznych, polegającą na identyfikacji profili komórek widocznych na obrazach i ich klasyfikacji. Podstawowymi kryteriami projektowania systemu była dokładność identyfikacji obiektów oraz szybkość działania programu. Szczególnie szybkość analizy nabiera w ostatnich czasach coraz większego znaczenia z uwagi na rozwój telepatologii oraz możliwości automatycznego skanowania całego preparatu. Tym samym coraz częściej ocenia się znacznie większe pola w preparatach, podnosząc obiektywność przeprowadzonej oceny. Dlatego rosną oczekiwania co do zdolności obliczeniowej projektowanych systemów i eliminowane są metody zbyt czasochłonne, które niewiele wnoszą do dokładności wyniku. Aby spełnić te oczekiwania, autor opracował wysoce wydajną metodę progowania sekwencyjnego połączonego z operacjami morfologicznymi wygładzania brzegów obiektów oraz kryterium oczekiwanej wielkości pojedynczych obiektów. Metoda ta, wspierana metodą działów wodnych i wysoce wydajnym klasyfikatorem SVM, jest w stanie zapewnić wysoką skuteczność rozpoznania w akceptowalnie krótkim czasie. Sieci SVM o gaussowskiej funkcji jądra zastosowane w rozwiązaniu pełnią podwójną rolę: zarówno wspomagają proces segmentacji, jak i dokonują rozpoznania typu komórek (funkcja klasyfikatora). W pracy zaproponowano ponadto zastosowanie sieci SVM z liniową funkcją jądra jako skutecznego deskryptora obiektów wspomagającego odróżnianie ich od tła. Takie podejście pozwala na uwolnienie się od problemów związanych z różnicowaniem obiektów na podstawie składowych barw obrazu, zastępując je liniową funkcją wyjściową sieci SVM. Dzięki temu problem określania wartości granicznych i funkcji przynależności obiektów do danej klasy jest rozwiązywany automatycznie, poprzez maksymalizację marginesu separacji między klasami. Uzyskane wyniki na bazie danych rzeczywistych obrazów pozwalają stwierdzić, że proponowane metody gwarantują wysoką skuteczność oceny ilościowej badanych preparatów i mogą być zastosowane w badaniach naukowych i do wspomagania diagnostyki patomorfologicznej. Ponadto proponowane metody przetwarzania obrazów porównano z innymi istniejącymi systemami opisanymi w publikacjach naukowych, wykazując ich wyższość, zwłaszcza w trudnych przypadkach (obrazy tkanek o wysokiej gęstości komórek). Rezultaty pracy mają duże znaczenie praktyczne i są stopniowo wdrażane do stosowania w Zakładzie Patomorfologii Wojskowego Instytutu Medycznego.
The monograph presents the chosen aspects of application of methods and tools applied to processing histological images, directed to support pathological diagnosis. The research is concerned with development of novel algorithms of segmentation and classification of color images by applying mathematical morphology and artificial neural networks Support Vector Machine (SVM). The SVM networks play a double role: as the classifier of objects and as the numerical descriptor supporting the process of extraction of objects from the image. Within the frame of this research the author has created a large data base of microscopic images of human pathological tissues. Five different types of cancer have been considered: three types of cancers of the central nervous system, breast cancer and skin cancer. Additionally, the inflammation of the upper part of the digestive tract (stomach inflammation) as well as angiogenesis of bone marrow have also been considered. Each case has been investigated on the basis of several dozen of digital images, representing different reactions and types of staining of appropriate tissues. The main task of the study was to develop an automatic system able to perform quantitative analysis of histological images, directed to the recognition of profiles of cells, existing in the image. The system should provide the accuracy of cell recognition comparable to the expert and at the same time be very quick and reliable. The speed of analysis is especially important nowadays, since it is of primary importance in telepathology, and enables to analyze the whole scanned specimen (instead of a chosen region) in a reasonable time, making the results of analysis more accurate and representative. To fulfill these requirements, the author has developed original sequential thresholding method, which in cooperation with mathematical morphology, the knowledge of the expected range of the size of individual objects, watershed algorithm and SVM classifiers, has enabled to build a quick and highly effective computerized system specialized for histological image analysis. The development system has been positively tested on numerous images, representing real cases taken from medical practice. A significant role in the development system is played by the Support Vector Machine. The SVM of Gaussian kernel is used as the classifier, supporting image segmentation and recognition. On the other hand, the SVM of linear kernel is used to form numerical description of the objects, helping to distinguish them from the background. Thanks to this function of SVM we were able to overcome the problem of variety of color intensity of cells in the image, making the system work more steadily at different conditions. The presented statistical results of testing the developed automatic system by using the data base containing numerous histological images corresponding to different types of pathological images have shown its high accuracy and speed, making it a very useful tool for supporting medical research and pathological diagnosis in hospital practice. The comparison to other known systems presented in scientific publications has shown its superiority, especially in difficult cases of images of tissue with very high cell density. The developed system is already implemented in the Military Institute of Health Services and is undergoing testing in medical practice.
  Instytut Elektrotechniki Teoretycznej i Systemów Informacyjno-Pomiarowych, Politechnika Warszawska
