Identyfikatory
Warianty tytułu
Clustering trajectories in clinical researches
Języki publikacji
Abstrakty
Wyniki badań klinicznych mogą tworzyć wielowymiarowe szeregi czasowe, które opisują zmiany w czasie istotnych parametrów opisujących stan zdrowia i kondycję pacjenta. Analiza tego typu danych polega na wyodrębnieniu typowych przebiegów - trajektorii w procesie analizy skupień. Klasteryzacja szeregów medycznych wiąże się z transformacją danych wejściowych: regularyzacją szeregu czasowego, uzupełnieniem brakujących danych, standaryzacją zmiennych. W dalszej kolejności należy dobrać liczbę skupień oraz wykonać grupowanie metodą k-średnich, DTW, PDC lub inną. Te algorytmy są dostępne w otwartych środowiskach obliczeń statystycznych, jednak aby ułatwić analitykom ich zastosowanie, został zbudowany pakiet medclust, który dostarcza wysokopoziomowych procedur, domyślnie sparametryzowanych do wyszukiwania skupień.
Clinical researches often involves measuring time-varying parameters of body condition, which forms multidimensional time-series. Typical, representative trajectories can be extracted with clustering algorithms. In order to apply clustering algorithms, raw data has to be preprocessed and this includes regularization of time series, imputation of missing values, values standardization. Next, one of time-series clustering can be applied: Dynamic Time Warping or Permutation Distribution Clustering. These algorithms are already available in open environments for statistical computing like R. In order to facilitate application of the clustering algorithms to the clinical reasarch data, new R package medclust was implemented. It provides analysts with ready-to-use high-level procedures with predefined set of parameters values to analyze clinical trajectories data.
Czasopismo
Rocznik
Tom
Strony
15--24
Opis fizyczny
Bibliogr. 5 poz., rys.
Twórcy
autor
- Wojskowa Akademia Techniczna, Wydział Cybernetyki ul. Gen. S. Kaliskiego 2, 00-908 Warszawa
Bibliografia
- 1. Sarda-Espinosa A.: Comparing Time-Series Clustering Algorithms in R Using the dtwclust Package.
- 2. Momtero P., Vilar J. A.: TSclust: An R Package for Time Series Clustering. Journal of Statistical Software, Vol. 62, 2014, www.jstatsoft.org.
- 3. Leisch F.: Creating R Packages: A Tutorial. https://cran.rproject.org/doc/contrib/Leisch-CreatingPackages.pdf.
- 4. Brandmaier A.M.: pdc: An R Package for Complexity-Based Clustering of Time-Series. Journal of Statistical Software, Vol. 67, 2015, www.jstatsoft.org.
- 5. Ordóñez P, desJardins M, Feltes C, Lehmann CU, Fackler J.: Visualizing Multivariate Time Series Data to Detect Specific Medical Conditions, AMIA Annual Symposium Proceedings, 2008;2008:530-534.
Uwagi
PL
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2019).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-22af2714-8e8c-4a73-9912-a6fc2e383dee