The paper focuses on presenting the concept of two-dimensional modeling of passenger car reliability during the warranty period. The main objective of this paper is to detect the regularity in the intensity of the number of first failure reports during the warranty period. The two-dimensional distribution of the time and mileage of failure-free exploitation is estimated. The period from the date of purchase to the first warranty repair is analysed. The concept presented incorporates the existing state of knowledge on two-dimensional warranties, expanding it through the use of a nonparametric approach and probability smoothing with the use of P-splines. The estimation involved censored data, i.e., data on vehicles that were not submitted for warranty repair within the warranty limits of time and mileage. The originality of this paper entails the combination of a nonparametric approach with probability smoothing. The statistical analyses presented in the paper were carried out on a population of 1005 vehicles of two car brands sold and serviced in 2011-2021 at the Authorized Service Station (Dealership). There were sales, repair, and warranty claim databases.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Estimators of quantile versions of the Lorenz curve are proposed. The pointwise consistency and asymptotic normality of the estimators is proved. The efficiency of the estimators is also studied in simulations.
PL
Zaproponowano nieparametryczne estymatory kwantylowych wersji krzywej Lorenza. Udowodniono punktową zgodność i asymptotyczną normalność zaproponowanych estymatorów. Porównano średnie scałkowane błędy kwadratowe wybranych nieparametrycznych estymatorów kwantylowych wersji krzywej Lorenza przy użyciu symulacji komputerowych.
The Probability Density Function (PDF) is a key concept in statistics. Constructing the most adequate PDF from the observed data is still an important and interesting scientific problem, especially for large datasets. PDFs are often estimated using nonparametric data-driven methods. One of the most popular nonparametric method is the Kernel Density Estimator (KDE). However, a very serious drawback of using KDEs is the large number of calculations required to compute them, especially to find the optimal bandwidth parameter. In this paper we investigate the possibility of utilizing Graphics Processing Units (GPUs) to accelerate the finding of the bandwidth. The contribution of this paper is threefold: (a) we propose algorithmic optimization to one of bandwidth finding algorithms, (b) we propose efficient GPU versions of three bandwidth finding algorithms and (c) we experimentally compare three of our GPU implementations with the ones which utilize only CPUs. Our experiments show orders of magnitude improvements over CPU implementations of classical algorithms.
4
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
The study is concerned with the nonparametric kernel estimation to determine the soil porosity and pore size distribution. The kernel density estimation, the kernel estimation of cumulative distribution function, and the kernel estimator of quantile are considered. After a short description of the method, practical aspects and applications in agricultural science are presented. The nonparametric kernel estimation does not require a priori assumptions relating to the choice of the density function shape. Moreover, its natural interpretation together with its suitable properties makes them an adequate tool among others in estimation methods.
PL
Przedmiotem niniejszego artykułu jest zastosowanie nieparametrycznej estymacji jądrowej do scharakteryzowania rozkładu wielkości porów glebowych. W artykule przedstawiono jądrowy estymator gęstości i dystrybuanty oraz opisano algorytm wyznaczania jądrowego estymatora kwantyla, istotne ze względu na badanie porowatości agregatów glebowych. Zagadnienia te zostały zilustrowane przykładowymi zastosowaniami w naukach rolniczych. Nieparametryczna estymacja jądrowa nie wymaga a priori założeń dotyczących kształtu funkcji gęstości rozkładu prawdopodobieństwa i jest uzasadniona w sytuacji braku znajomości jej teoretycznego modelu. Ze względu na swobodę w doborze jądra oraz procedur wyznaczania parametrów estymatora możliwe jest dostosowanie jego własności do uwarunkowań konkretnego problemu.
W pracy pokazano przykład użycia nieparametrycznej estymacji danych. Z pomocą tej techniki dokonano oszacowania emisji tlenków azotu (NOx) na podstawie danych eksploatacyjnych zbieranych podczas normalnej pracy Elektrociepłowni w Zielonej Górze. Na wstępnie dokonano krótkiego przeglądu najbardziej popularnych technik estymacji parametrycznej i porównano je z technikami nieparametrycznymi. Następnie na prostym przykładzie pokazano istotę działania estymacji nieparametrycznej. Pracę kończy rozdział, w którym krótko omówiono uzyskane wyniki symulacyjne.
EN
In the paper there are shown some practical examples of using nonparametric estimation. Using this technique there were estimated the nitrogen oxides (NOx) emissions based on the data taken from a real industry plant (gas and steam combined heat and power (CHP) plant in Zielona Góra, Poland). This work can be treated as a continuation of the paper [2]. In the first section there is given a short overview of estimation methods, including the linear and nonlinear regression, and comparison of them with nonparametric ones. In the second section there is briefly presented the nonparametric estimation technique and there is given a simple illustrative example. The third paragraph is dedicated to presenting the experimental results. Basing on the data from the CHP plant, the NOx emission was estimated and the satisfactory results (in comparison, for example, with the results obtained from the linear regression estimator) were obtained. All calculations were carried out using np package for R-project environment which implements a variety of nonparametric (and also semiparametric) kernel-based estimators.
Poniższa praca porusza temat nieparametrycznej estymacji funkcji regresji oraz jej efektywności czasowej. Autorzy porównują dokładność regresji, ale i czas potrzebny na wyznaczenie wartości dla obiektu testowego. Czas ten uwzględnia nie tylko samo wyznaczanie wartości, ale i etap tworzenia regresora. Eksperymenty zostały przeprowadzone na wielowymiarowych danych rzeczywistych.
EN
This paper raises a problem of nonparametric estimation of the regression function and its time efficiency. Authors compare the regression accuracy but considers also the time that is needed to evaluate the value for the test object. That time takes into consideration the evaluation time, but also the time of regressor creating. Experiments were conducted with the usage of multidimensional real data.
7
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Metody nieparametryczne znajdują coraz szersze zastosowanie w zagadnieniach współczesnej analizy i eksploracji danych. W artykule przedstawiono najpopularniejsze narzędzie powyższych metod - estymatory jądrowe. Poza koncepcją tychże estymatorów zaprezentowano także praktyczne aspekty estymacji oraz przykłady jej zastosowań do wyznaczania rozkładów z dziedziny fizyki wysokich energii, wykrywania uszkodzeń silnika asynchronicznego oraz analizy danych socjologicznych.
EN
Nonparametric methods find increasing number of applications in the area of data analysis and data exploration. In this paper the most popular tool of those methods was presented - kernel estimators. Beside of kernel estimators' concept, practical estimation aspects and examples of applications in determining distributions from nuclear physics experiments, induction motors' damage detection and analysis of sociological data were shown as well.
W artykule dokonany został przegląd wybranych metod estymacji nieparametrycznej, wykorzystanych do szacowania współczynnika selektywności zapytań. Artykuł koncentruje się głównie na metodzie estymacji jądrowej, użytej do przybliżania nieznanej funkcji gęstości, opisującej rozkład wartości atrybutu tablicy bazy danych. Estymowana funkcja gęstości pozwala na oszacowanie selektywności zapytań wykorzystywanej przez optymalizator zapytań. Pokazana jest koncepcja wykorzystania metody estymacji jądrowej dla wyznaczania selektywności łącznie dla zbioru atrybutów, bez zakładania niezależności tychże, na podstawie wielowymiarowego estymatora jądrowego.
EN
The article presents a survey of methods of nonparametric estimation used' for estimation of query selectivity. The article mainly focuses on kernel estimation used for approximation of unknown density function of distribution of values from database table attribute. An approximation of density function lets calculate a query selectivity, used by database query optimizer. The paper presents multidimensional kernel estimator used for calculation of common query selectivity for set of attribute without the assumption of attributes independence.
9
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
The traditional estimation procedure is to choose a parametric probability model and then estimate the values of its parameters. Such apprroach is commonly applied in hydrology, but there are no reasons to suppose that we known the true probability density function, and so we can make a mistake in the first stage of the estimation prrocess. The new method of estimation - nonparametric density estimation - is presented in this paper. The nonparametric estimation does not require a priori assumption about the shape of density function. The method directly uses the information included in a data set and therefore in some cases can give the better results than the parametric methods. The main goal of this work is to show some selected applications of nonparametric estimation to the hydrological problems. The basic assumptions concerned to nonparametric estimation are presented in section 2. Section 3 shows three application of this method in hydrology. Data visualization is proposed as a first (section 3.1). Figures 2-3 presents nonparametrric estimators with the histograms of the maximum and minimum annual flow selected rivers. In section 3.2 nonparametric estimation of flood probability is compared with parametric estimation and fig. 4 shows the results of the both methods. As the last, the investigation and testing for multimodality is discussed in section 3.3. Two and three-modal density functions of yearly maximum flow are presented on fig. 5. It is not easy to say at this stage, which method is the best. However, the results of estimation presented in this paper shows that the nonparametric estimation in some cases can replace trraditional methods, in some cases it can be complementary to them, orr can create a new possibilities, e.g. when is used to investigate multimodality.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.