Ten serwis zostanie wyłączony 2025-02-11.
Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 3

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  multivariate methods
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The problem of insufficient number of sample observations representing a given population domain of interest (small area) can be solved by applying such estimators, which will be able to combine sample information from the given domain with information about sample units representing other domains. One small area estimation method, called synthetic estimation technique, assumes that the distribution of the variable of interest is identical in the given domain and in the entire population. This assumption, however, is rarely met, and as a result one obtains large estimation errors. In this paper a two-stage estimation procedure is suggested. The first stage consist in applying various classification methods to identify the degree of similarity between the sample units from the investigated domain and sample units representing other domains. In the second stage, those domains, which turned out to be similar to the domain of interest or sample units similar to units from domain of interest, are used to provide sample information with specially constructed weights. Authors present the results of the suggested procedure in an analysis of the continuing vocational training in construction industry based on a sample survey of enterprises. A bootstrap attempt has been made to assess errors of the suggested estimation procedure.
PL
Problem zbyt małej liczby obserwacji w próbie, reprezentującej określoną domenę populacji, może być rozwiązany m. in. poprzez estymatory wykorzystujące informacje o innych jednostkach w próbie. Jedna z metod estymacji dla małych domen, zwana estymacją syntetyczną, zakłada, że rozkład w badanej małej domenie jest identyczny z rozkładem całej populacji. Założenie to pozostaje zazwyczaj niespełnione, zwłaszcza w przypadku specyficznych domen, co skutkuje dużymi błędami estymacji. Problem niespełnienia założeń estymacji syntetycznej może być rozwiązany poprzez zastosowanie dwuetapowego procesu estymacji. W pierwszym etapie za pomocą metod analizy wielowymiarowej, np. za pomocą metody klasyfikacji k-średnich, badania odległości czy też wykorzystując sieci neuronowe typu SOM, określa się podobieństwa domen lub jednostek należących do małej domeny do jednostek z pozostałej części próby. Drugim krokiem jest wykorzystanie w estymacji, za pomocą odpowiednio skonstruowanych wag, informacji tylko o tych jednostkach lub z tych domen, które są podobne do badanej małej domeny. W artykule autorzy przedstawiają rezultaty zastosowanej metody na przykładzie badania reprezentacyjnego kształcenia ustawicznego w branży budowlanej. Za pomocą metod bootsrtrapowych dokonano oceny wpływu stosowania różnych metod badania podobieństw między jednostkami na własności modyfikowanego estymatora syntetycznego.
EN
In many statistical surveys one faces the problem of insufficient number of sample observations to make reliable inference about a given population domain of interest (small area). One possible solution, which has been discussed in statistical publications consists in applying estimators, which will be able to combine sample information from the given domain with information about sample units representing other domains. Synthetic estimation technique is particularly efficient, if the distribution ot the variable ot interest is the same in the given domain and in the entire population. When this assumption is far from being met, one can obtain, as a consequence, large estimation errors. Using modified synthetic estimator requires an application of a two-stage estimation procedure. The first stage consists in applying some distance measures in order to identify the degree of similarity between the sample units from the investigated domain and sample units representing other domains. In the second stage, those units, which turned out to be similar to units from the domain of interest, are used to provide sample information with specially constructed weights. A method of establishing weights is one of the crucial factors in using MES estimator. Author presents results of Monte Carlo analysis of the efficiency of MES estimator using different weights.
PL
Problem zbyt małej liczby obserwacji w próbie, reprezentującej określoną domenę populacji, może być rozwiązany między innymi poprzez zastosowanie takich estymatorów, które do szacowania parametrów w określonej subpopulacji (małym obszarze, domenie) wykorzystują dodatkowe informacje z pozostałej części próby. Jedna z metod estymacji dla małych domen zwana estymacją syntetyczną sprawdza się przy założeniu, że rozkład (albo któryś z parametrów rozkładu) w badanej małej domenie jest identyczny z rozkładem całej populacji. Założenie to pozostaje zazwyczaj niespełnione, zwłaszcza w przypadku specyficznych domen, co skutkuje dużymi błędami estymacji. Zastosowanie zmodyfikowanego estymatora syntetycznego (MES) zakłada dwuetapowy proces estymacji. W pierwszym etapie za pomocą metod klasyfikacji lub badania podobieństw określa się podobieństwa jednostek należących do małej domeny do jednostek z pozostałej części próby. Drugim krokiem jest wykorzystanie w estymacji, za pomocą odpowiednio skonstruowanych wag, informacji tylko od tych jednostek, które są podobne do jednostek z małej domeny. Ważnym czynnikiem wpływającym na efektywność zmodyfikowanego estymatora syntetycznego jest dobór metod ustalania wag dla poszczególnych jednostek badanej zbiorowości. Autor przedstawia wyniki symulacyjnego badania efektywności estymatora MES przy zastosowanych różnych sposobach ustalania wag.
|
|
nr 3
5-17
PL
Artykuł stara się odpowiedzieć na pytanie, czy możliwe jest ustalenie typologii polskich tekstów wyłącznie na podstawie ich cech gramatycznych. Dodatkowym celem było ustalenie, czy typologia przyjęta w Narodowym Korpusie Języka Polskiego, oparta na kryteriach pozajęzykowych, rzeczywiście grupuje teksty, które są do siebie gramatycznie podobne. Badanie przeprowadzono na korpusie 1190 tekstów wybranych losowo z Narodowego Korpusu Polskiego. W każdym z tekstów zbadano frekwencję ok. 60 cech gramatycznych, takich jak liczba słów należących do poszczególnych części mowy bądź występujących w konkretnym przypadku, osobie lub czasie gramatycznym itp. Na podstawie tych danych przeprowadzono analizę Bootstrap Consensus Network, a także skalowanie wielowymiarowe. Rezultaty potwierdzają, że większość tekstów przynależnych w NKJP do danego typu rzeczywiście wykazuje wzajemne podobieństwo pod względem frekwencji poszczególnych kategorii gramatycznych.
EN
The article seeks to answer the question whether it is possible to establish a typology of Polish texts based exclusively on their grammatical features. An additional aim was to find whether the typology adopted in the National Corpus of Polish (NCP), based on purely extra-linguistic criteria, groups together texts that are grammatically similar. The study was conducted on a corpus of 1190 texts randomly chosen from the NCP. For each text the frequency of some 60 grammatical features was counted, such as the number words belonging to a part of speech, occurring in a particular case, person or tense etc. With these data Bootstrap Consensus Network analysis as well as multidimensional scaling was conducted. The results show that most members of a text type cluster together showing similarity one to another. Moreover, the typology of texts adopted in the NCP gains additional support.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.