Warianty tytułu
Reference set condensation with controlling the compromise between the speed and the quality of classification
Języki publikacji
Abstrakty
W wielu systemach przetwarzania danych (obrazów) na klasyfikację mamy określony limit czasu. W takim przypadku wskazana jest możliwość sterowania pomiędzy szybkością klasyfikacji a jej jakością. Jednym z prostszych podejść jest podział zbioru uczącego na podzbiory i dokonanie ich kondensacji (w tym wypadku metodą znajdowania punktów wzajemnie najdalszych). Autorzy proponują dekompozycję uczenia na kilka cyklicznie powtarzających się podzadań, które można przerwać w dowolnym momencie, uzyskując najlepszą w danej chwili klasyfikację. Przeprowadzone eksperymenty dowodzą, że wskutek zaproponowanej dekompozycji zyskujemy możliwość sterowania czasem i jakością dokonywanych klasyfikacji.
Many pattern recognition systems can have limited time for classification, mainly in applications concerned the quality control in industry. One of the simplest classifiers, known as a nearest neighbor rule, can be used for approximation of any other kind of classifiers, for instance the more sophisticated k nearest neighbor classifier. The k nearest neighbor classifier (k-NN) offers very good classification quality and converges to the theoretically best possible classification rule called the Bays classifier. The classification speed depends linearly on the reference set size, so classification can be accelerated by the decreasing the size of the reference set. The easiest way to control a compromise between the speed of classification and its quality consists in division of the training set into some subsets. The gravity centers of these subsets form a condensed reference set for the nearest neighbor rule. Division of the original reference set, i.e. the whole training set, starts with one set, then this set is divided into two subsets, next one of this two subsets is divided and so on, until each subset will contain only one object, that is a point in the feature space.
Rocznik
Tom
Strony
447-454
Opis fizyczny
Bibliogr. 8 poz., rys., wykr., tab.
Twórcy
autor
- Katedra Informatyki Stosowanej, Politechnika Łódzka
autor
- Katedra Informatyki Stosowanej, Politechnika Łódzka
Bibliografia
- [1] Aeberhard S., Coomans D., deVel O.: Comparison of Classifiers in High Dimensional Settinos Tech. Rep. nr. 92-02, Department of Computer Science and Department of Mathematics and Statistics, James Cook University of North Queensland, 1992
- [2] Fisher R.A.: The use of multiple measurements in taxonomic problems. Annual Eugenics, USA nr 7, t. II, 1936, 179-188
- [3] Merz Ch., Murphy P.M.: UCI repository of machine learning databases. [http://www.ics uci edu/~mlearn/MLRepository.html], 1996
- [4] Moghaddam B. Pentland A.: An automatic system for model based coding of faces. IEEE International Conference on Image Processing, Washington DC, USA, 1995
- [5] Skrabek W.: Multimedia - Algorytmy i Standardy Kompresji. AOWPLJ, Warszawa, 1998
- [6] Smith J.W., Everhart J.E., Dickson W.C., Knowler W.C., Jonannes R.S.: Using the ADAP learning algorithm toforecast the onset of diabetes mellitus. Proceedings of the Symposium on Computer Applications and Medical Care, IEEE Computer Society Press, USA, 1988, 261-265
- [7] Tadeusiewicz R., Flasiński M.: Rozpoznawanie obrazów. Warszawa, PWN 1991
- [8] Wiley J.: Contributions to Mathematical Statistics. NY, USA, 1950
Identyfikator YADDA
bwmeta1.element.baztech-article-AGH1-0010-0066