The aim of this paper is to provide a gradient clustering algorithm in its complete form, suitable for direct use without requiring a deeper statistical knowledge. The values of all parameters are effectively calculated using optimizing procedures. Moreover, an illustrative analysis of the meaning of particular parameters is shown, followed by the effects resulting from possible modifications with respect to their primarily assigned optimal values. The proposed algorithm does not demand strict assumptions regarding the desired number of clusters, which allows the obtained number to be better suited to a real data structure. Moreover, a feature specific to it is the possibility to influence the proportion between the number of clusters in areas where data elements are dense as opposed to their sparse regions. Finally, the algorithm-by the detection of one-element clusters-allows identifying atypical elements, which enables their elimination or possible designation to bigger clusters, thus increasing the homogeneity of the data set.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
In this paper, a method for determining the soil pore size distribution, constituting the subject of the presented investigations, is proposed. A research study was conducted using image analysis algorithms, and in turn, nonparametric statistical techniques. The results and further work will be discussed in section four. The purpose of this investigation is to discover the relationship between the pore size and volume of the corresponding pores. The algorithm presented here is based on the theory of statistical kernel estimators. This frees it of assumptions in regard to the form of regression function. The approach is universal, and can be successfully applied for many tasks in data mining, where arbitrary assumptions concerning the form of regression function are not recommended.
PL
Celem niniejszego artykułu jest zaprezentowanie procedury wyznaczania rozkładu wielkości porów w agregatach glebowych. Do scharakteryzowania zależności pomiędzy badanymi zmiennymi wykorzystana zostanie funkcja regresji. W przeprowadzonych badaniach zastosowano algorytmy analizy obrazów cyfrowych oraz metodykę statystycznych estymatorów jądrowych. Przedstawiona metoda umożliwia uzyskanie właściwej charakterystyki rozkładu wielkości porów i może stanowić efektywne narzędzie stosowane w wielu zagadnieniach eksploracji danych. Jako model nieparametryczny, nie wymaga założeń dotyczących kształtu zależności funkcyjnej między rozpatrywanymi zmiennymi.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.