The paper focuses on latent class models and their application for quantitative data. Latent class modeling is one of multivariate analysis techniques of the contingency table and can be viewed as a special case of model-based clustering, for multivariate discrete data. It is assumed that each observation comes from one of the numbers of subpopulations, with its own probability distribution. We used latent class analysis for grouping and detecting homogeneity of Silesian people using poLCA package of R. We analyzed data collected by the Department of Social Pedagogy, University of Silesia in Katowice.
Najczęściej w różnych analizach statystycznych wykorzystywane są klasyczne metody analizy skupień, opierające się na podejściu heurystycznym. W referacie zaprezentowane zostanie podejście modelowe w analizie skupień (model-based clustering), bazujące na modelach probabilistycznych. W części empirycznej referatu podejście to zostanie porównane z klasycznymi metodami taksonomicznymi (metodami hierarchicznymi oraz metodami iteracyjno- aglomeracyjnymi).
Item response theory is considered to be one of the two trends in methodological assessment of the reliability scale. In turn, latent class models can be viewed as a special case of model-based clustering, for heterogenous multivariate discrete data. We used the approach combining item response theory and latent class models to find groups of Polish households’ with similar saving ability levels. We analyzed data collected as part of the Polish Social Diagnosis using MultiLCIRT package of R.
In the paper the problem of learning of Gaussian mixture models (GMMs) is considered. A new approach based on hybridization of a self-adaptive version of differential evolution (DE) with the classical EM algorithm is described. In this approach, called DEEM, the EM algorithm is run until convergence to fine-tune each solution obtained by the mutation and crossover operators of DE. To avoid the problem with parameter representation and infeasible solutions we use a method in which the covariance matrices are encoded using their Cholesky factorizations. In a simulation study GMMs were used to cluster synthetic datasets differing by a degree of separation between clusters. The results of experiments indicate that DE-EM outperforms the standard multiple restart expectation-maximization algorithm (MREM). For datasets with high number of features it also outperforms the state of-the-art random swap EM (RSEM).
PL
W pracy poruszono problem uczenia modeli mieszanin rozkładów normalnych. Zaproponowano nowe podejście, nazwane DE-EM, oparte na hybrydyzacji samoadaptacyjnego algorytmu ewolucji różnicowej i klasycznego algorytmu EM. W nowej metodzie rozwiązanie otrzymane jako wynik operatorów mutacji i krzyżowania jest poddawane optymalizacji lokalnej, prowadzonej aż do momentu uzyskania zbieżności, przez algorytm EM. Aby uniknąć problemu z reprezentacją macierzy kowariancji i niedopuszczalności rozwiązań użyto metody, w której macierze kowariancji są kodowane przy pomocy dekompozycji Cholesky’ego. W badaniach symulacyjnych modele mieszanin rozkładów normalnych zastosowano do grupowania danych syntetycznych. Wyniki eksperymentów wskazują, że metoda DE-EM osiąga lepsze wyniki niż standardowa technika wielokrotnego startu algorytmu ˙ EM. Dla zbiorów danych z dużą liczbą cech, metoda osiąga lepsze wyniki niż technika losowej wymiany rozwiązań połączona z algorytmem EM.
Latent class analysis can be viewed as a special case of model-based clustering for multivariate discrete data. When longitudinal data are to be analysed, the research questions concern some form of change over time. The latent Markov model is a variation of the latent class model that is applied to estimate not only the prevalence of latent class membership, but the incidence of transitions over time in latent class membership. In 2004, Poland joined the European Union, prompting a number of Poles to leave the country. To examine this event, a model-based clustering approach for grouping and detecting inhomogeneities of public attitudes to emigration from Poland was used. It focuses especially on latent Markov models with covariates, which additionally made it possible to investigate the dynamic pattern of Poles’ attitudes to emigration for different demographic features. depmixS4, Rsolnp and LMest packages of R were used.
PL
Modele mieszanek, których składowe charakteryzowane są przez rozkłady prawdopodobieństw, reprezentują tzw. podejście modelowe w taksonomii. Obecnie coraz popularniejsze są modele mieszanek w analizie danych panelowych, w której celem jest już nie tylko podział obserwacji na homogeniczne grupy, ale również pewna analiza zmian w czasie. W takim przypadku stosowane są ukryte modele Markowa. W 2014 r. minęło 10 lat od przystąpienia Polski do Unii Europejskiej. Okres taki pozwala na dokonanie analizy nastawienia Polaków do emigracji. Celem badań jest podział Polaków na klasy o podobnym nastawieniu do emigracji w latach 2004–2013. Analiza empiryczna przeprowadzona została za pomocą ukrytych modeli Markowa z uwzględnieniem zmiennych towarzyszących. Wykorzystane zostały pakiety depmixS4, Rsolnp oraz LMest programu R.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.