Praca dotyczy problemu estymacji dominanty rozkładu prawdopodobieństwa wielowymiarowej zmiennej losowej. Zajmowano się problemem estymacji dominanty zmiennej losowej ciągłej. Analizowano jednomodaine rozkłady prawdopodobieństwa. W niniejszej pracy analizowano głównie klasę rozkładów prawdopodobieństwa zmiennych losowych charakteryzującą się tym, że zachodzą dla nich pewne nierówności między wartościami oczekiwanymi i dominantą rozkładu funkcją jego trzecich momentów centralnych. Dla takiej klasy rozkładów są wprowadzone dwa estymatory dominanty, których wyznaczanie w praktyce ma charakter iteracyjny. Z grubsza rzecz biorąc, wyliczenie wartości estymatora dominanty wiąże się z sukcesywnym obcinaniem obserwacji próby do chwili, gdy zostaną spełnione pewne warunki, a w szczególności, że pewna funkcja trzech mieszanych momentów centralnych rozkładu uciętego osiągnie wartość zero. Wówczas oceną punktu będącego dominantą rozkładu wielowymiarowego są właśnie średnie z uciętych rozkładów brzegowych z próby. Proponowane estymatory mogą być obciążone. W niektórych przypadkach dało się oszacować maksymalny poziom takiego obciążenia. Proponowane są również dwa estymatory regresji modalnej.
EN
The problem of estimation of the mode of a continuous distribution function of multidimensional random variable is considered. The estimator of the mode is the vector of means from appropriately truncated sample. The truncation sample is obtained th rough rejecting the observation in such a way that the measure of skewnees of multidimensional variable takes value as close zero as possible. We can expect that through successful truncation of the sample the vector of sample means approach to vector of modes of multidimensional variable. The estimator constructed in such a way is usually biased estimators of the mode. Moreover, the biased estimators of values of modal regressions are proposed. The well known “jackknife” procedure is proposed to evaluate the mean square errors of the estimators.
Estimation of the population average in a finite population by means of sampling strategy dependent on the sample quantile of an auxiliary variables is considered. The sampling design is proportionate to the determinant of the matrix dependent on some quantiles of an auxiliary variables. The sampling scheme implementing the sampling design is proposed. The derived inclusion probabilities are applied to estimation the population mean using the well known Horvitz-Thompson estimator. Moreover, the regression estimator is defined as the function of the coefficient dependent on the quantiles of the auxiliary variables. The properties of this estimator under the above defined sampling design are studied. The considerations are supported by empirical examples.
PL
Problem oceny wartości średniej z wykorzystaniem danych o wszystkich wartościach cech pomocniczych jest rozważany. W tym celu znany estymator regresyjny zależny od wielu zmiennych pomocniczych jest wykorzystywany. W odróżnieniu od zwykłego podejścia znanego w metodzie reprezentacyjnej do oceny parametrów regresji są wykorzystywane kwantyle jednej ze zmiennych dodatkowych. Otrzymane na tym polu wyniki są adoptowane do konstrukcji predytorów wartości średniej w nadpopulacji. Wyprowadzono również wariancje różnych odmian proponowanych predykatorów.
Survey sampling conditional methods are usually connected with poststratification estimators for domains and with inference on the basis of regression models or contingency tables. These problems were considered e.g. by Rao (1985), Tillé (1998), Williams (1962). The problem of stratification of a population on the basis of observations on the variable under study in a sample was considered by e.g. Dalenius (1957). We deal with the problem of appropriate division of a simple sample into sub-samples of equal sizes. This partition of the sample leads to clustering a population into sub-populations. Each of these sub-populations includes one and only one previously created sub-sample. The linear combinations of statistics from the sub-samples are used for estimation of a population mean. The coefficients of this linear combination are proportionate to the sizes of the sub-populations. This statistic is the unbiased estimator of the population mean. The variance of the estimator has been derived. The example of determining of the estimator parameters is presented. Moreover, some generalisations of proposed estimators are suggested.
PL
Problem estymacji wartości przeciętnej w populacji na podstawie próby prostej losowanej bezzwrotnie z populacji ustalonej i skończonej jest rozważany. Zakładamy, że wartości zmiennej pomocniczej są obserwowane w całej populacji. Próba prosta, po jej wylosowaniu, jest porządkowana zgodnie z rosnącymi wartościami zmiennej pomocniczej. Następnie próba ta jest dzielona na H > 1 równolicznych podprób. Potem zlicza się, ile jest elementów populacji pomiędzy elementami rozdzielającymi podpróby. Udziały tych liczebności stanowią współczynniki kombinacji liniowej, m.in. średnich z podprób. Taki warunkowy estymator daje nieobciążone (warunkowo i bezwarunkowo) oceny wartości średniej w populacji. Pokazano przykład oceny wartości średniej w populacji z wyznaczeniem wartości wariancji warunkowych i bezwarunkowych estymatora.
The estimation of a vector of mean values is being considered. The vector estimator consists of simple cluster sample means. It is assumod that a population of a fixed size is divided into mutually disjoint clusters each of the same size. The variance-covariance matrix of the vector estimator is derived. It is a function of a homogeneity matrix of multidimensional variable which describes within-cluster spread of the multidimensional variable under research. The accuracy of estimation is measured by means of standard deviations of particular sample cluster means as well as by means of the trace or the determinant or the maximal eigenvalue of the variance-covariance matrix of the vector estimator. The accuracy of the vector of simple sample cluster means is compared with the accuracy of the vector of the simple sample means. The accuracy of the vector of simple sample cluster means increases when the degree of within-cluster spread of the distribution of a multidimensional variable increases. Hence, the population should be divided into such clusters that the within-cluster spread is as large as possible.
PL
Zakłada się, że skończona i ustalona populacja jest podzielona na równoliczne i rozłączne grupy. Na podstawie prostej próby grupowej jest wyznaczany wektor średnich, który daje oceny wektora przeciętnych w populacji. Wyprowadzono macierz wariancji i kowariancji wektora wartości średnich z próby grupowej. Jest ona zależna od macierzy wewnątrzgrupowej jednorodności rozkładu wielowymiarowej zmiennej. Precyzja estymacji jest oceniana za pomocą wariancji poszczególnych średnich z próby grupowej, śladu, wyznacznika lub maksymalnej wartości własnej macierzy wariancji i kowariancji. Precyzja wektora średnich z próby grupowej jest porównywana z precyzją wektora średniej z próby prostej. Okazuje się, że wektor średnich z próby grupowej jest precyzyjniejszy od wektora przeciętnych z próby prostej, gdy stopień wewnątrzgrupowego zróżnicowania wartości zmiennych jest dostatecznie duży.
The trend of time series can change its direction. It is assumed that the time interval is divided into subintervals where the trend is given as particular linear function. The problem is how to divide the observation of time series into disjoint and coherent groups where they have linear trend. That is why the problem of the scatter of multivariable observation was first considered. The degree of data spread is measured by means of a coefficient called a discriminant of multivariable observation. It is equal to the sum of volumes of the parallelotops spanned on multidimensional observations. On the basis of it the modifications of the well known generalized variance were introduced. Geometrical properties of those parameters were investigated. The obtained results are used to generalize well-known clustering methods of Ward. One of the advantages of the method is that it finds clusters of high linear dependent multivariate observations. Finally, the results are used to partition a time series into homogeneous groups where observations are close to linear trend. There is considered an example.
The quadratic form of the sample mean and sample variance was considered. The sample is from normal distribution. The density function of the quadratic form has been derived. The quadratic form can be applied as the test statistic for the hypothesis on expected value and variance of normal distribution. The table with approximated critical values of the test statistic has been derived.
In the paper we present the examples of forecasts of time series with seasonal fluctuations. Based on the jackknife method we estimate variances of seasonal factors and the MSE of prediction. Jackknife method has been introduced by M. Quenouille (1949) and then it has been developed among others by J. Tukey (1958) and J. Shao, D. Tu (1995).
PL
W pracy zaproponowano wykorzystanie metody jackknife do prognozowania szeregów czasowych. Oprócz problemu prognozowania tą metodą, podjęto także problem oceny średniego błędu tak wyznaczanych prognoz. W oparciu o rzeczywiste dane zaprezentowane zostały przykłady prognozowania szeregów czasowych z wahaniami sezonowymi przy wykorzystaniu wersji jackknife metody wskaźników sezonowości. Oprócz wyznaczenia wartości prognozowanej w rozważanym przypadku będzie możliwa ocena wariancji błędu predykcji. Metodę jackknife wprowadził M. Quenouille (1949), a była rozwijana m. in. przez J. Tukey’a (1958) oraz J. Shao i D. Tu (1995).
he problem of prediction of the total value in a domain based on simple regression superpopulation model (with one auxiliary variable and no intercept) is considered. The problem of robust estimation against outliers of regression function's parameter is shown. The presented robust estimator is median value of gradients of all straight lines each determined by the origin and one of n points (x, y), where n is sample size, у - the variable of interest and x - auxiliary variable. This estimator is simplified form of the estimator presented by H. Theil (1979). The equation of the mean square error of the robust predictor based on the robust estimator of regression's parameter is derived for asymptotic assumptions. The best linear predictor based on the considered superpopulation model is presented. The equation of mean square error of the BLU predictor is derived. The accuracy of these predictors is compared for the assumption of normal distribution of variables of interest.
PL
Rozważany jest problem predykcji wartości globalnej w domenie przy założeniu prostego modelu regresyjnego nadpopulacji (model regresyjny z jedną zmienną objaśniającą i bez stałej). Podjęty zostaje problem odpornej na wartości oddalone estymacji parametru funkcji regresji. Zaprezentowany estymator parametru funkcji regresji jest medianą wszystkich współczynników kierunkowych prostych przechodzących przez początek układu współrzędnych i jeden z n punktów (x, y), gdzie n oznacza liczebność próby, x - zmienną dodatkową, а у - zmienną badaną. Estymator ten jest uproszczoną formą estymatora prezentowanego w: H. Theil (1979). Autorzy przy asymptotycznych założeniach wyprowadzają wzór na błąd średniokwadratowy predykcji rozważanego predyktora odpornego. Przedstawiony zostaje także predyktor typu BLU dla zakładanego modelu nadpopulacji wraz z błędem średniokwadratowym predykcji. Dokładność obu predyktorów zostaje porównana przy założeniu normalności rozkładu badanych zmiennych losowych.
Testing the goodness of fit between a hypothetical trend function and its non-parametric variant will be considered. This problem was analysed e.g. by Domanski (1979, 1990), Wywiał (1990, 1995). Our result can be treated as a modification of the test proposed by Azzalini and Bowman (1993). The hypothetical trend function will be denoted by f(t, θ). It is estimated by an unbiased method. A trend function can be estimated by means of an non-parametric method. Azzalini and Bowman suggested testing the hypothesis on the linearity of the trend on the basis of the ratio of two residual variances. One of them is the residual variance of the trend estimated by means of the least square method and the other one by means of a non-parametric method. The well known Pearson curves are used for an approximation of the distribution function of the ratio. We use a different method in order to approximate the distribution of the test statistic. The table with quantiles of the test statistic are evaluated.
PL
W artykule rozważano pewną modyfikację testu dla hipotezy głoszącej, że trend szeregu czasowego ma postać liniową, który zaproponowali Azzalini i Bowman (1903). Statystyka testowa jest ilorazem wariancji resztowej estymatora wartości funkcji liniowej trendu uzyskanej metodą najmniejszych kwadratów i pewnej formy kwadratowej reszt oceny trendu otrzymanego metodą estymacji jądrowej. Wysokie wartości tego ilorazu świadczą przeciwko hipotezie o liniowości funkcji trendu. Ze względu na złożoną postać proponowanej statystyki Azzalini i Bowman wykorzystali do aproksymacji jej rozkładu prawdopodobieństwa tzw. krzywe Pearsona W niniejszym artykule stosuje się do przybliżenia rozkładu sprawdzianu testu inną metodę wykorzystującą technikę całkowania numerycznego. Przy założeniu liniowej postaci funkcji trendu pozwoliło to wyznaczyć numerycznie kwantyle rzędu 0,9, 0,95 i 0,99 rozważanej statystyki testowej. Przedstawione wartości kwantyli mogą stanowić podstawę do podjęcia decyzji o ewentualnym odrzuceniu hipotezy o postaci trendu liniowego.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.