Wyniki wyszukiwania - BazTech

1

Wstępne przetwarzanie danych

Ciupke Krzysztof

Utrzymanie Ruchu

|

2020

|

Nr 4

58--60

PL

Zbiory danych mogą stać się cennym źródłem wiedzy. Aby tak się jednak stało, musimy we właściwy sposób podejść do ich analizy. Proces analizy danych składa się z kilku etapów (opisanych w nr. 1/2020 „Utrzymania Ruchu” w artykule Analiza dużych zbiorów danych). Kluczowym etapem jest etap wstępnego przetwarzania danych, który bezpośrednio poprzedza etap eksploracji i jest często etapem najbardziej pracochłonnym.

2

Selekcja danych eksploatacyjnych z urządzeń sterowania ruchem kolejowym na potrzeby procesów gromadzenia i analizy danych z obiektów transportu kolejowego

Dyduch Janusz, Kornaszewski Mieczysław

Przegląd Komunikacyjny

|

2019

|

R. 74, nr 5

21--26

PL

Ocena niezawodności i bezpieczeństwa systemów technicznych wymaga gromadzenia i przetwarzania wiarygodnych danych charakteryzujących zachodzące procesy. Szczególnie istotnymi danymi dla procesów decyzyjnych są te pochodzące z bieżącej eksploatacji, gdyż mogą one posłużyć do zbudowania modeli zachodzących zjawisk eksploatacyjnych i pozwolą określić spodziewane zachowanie się obiektu w przyszłości. Urządzenia sterowania ruchem kolejowym (srk) funkcjonują często w bardzo trudnych warunkach eksploatacyjnych i środowiskowych. Gromadzenie informacji o ich stanie technicznym może być wykorzystywane do właściwej profi laktyki tych urządzeń, a także do predykcyjnego utrzymania ruchu kolejowego. Pozwoli to również na dobór takiej strategii utrzymania ruchu kolejowego, która będzie miała przełożenie na optymalne użytkowanie urządzeń srk.

EN

The evaluation of the technical systems reliability and safety requires collecting and processing of reliable data which characterizes the processes. The data from current exploitation is particularly important for decision-making processes. It can be used for creation of occurring exploitation phenomena models and allows to determine the expected object behaviour in the future. The railway traffic control devices often work in very difficult exploitation and environmental conditions. The information about their technical condition can be gathered and used for a proper prophylaxis as well as a predictive maintenance of railway traffic. It will allow to choose a maintenance strategy which will consist in optimal use of railway traffic control devices.

3

On the predictive power of meta-features in OpenML

Bilalli B., Abelló A., Aluja-Banet T.

International Journal of Applied Mathematics and Computer Science

|

2017

|

Vol. 27, no. 4

697--712

EN

The demand for performing data analysis is steadily rising. As a consequence, people of different profiles (i.e., nonexperienced users) have started to analyze their data. However, this is challenging for them. A key step that poses difficulties and determines the success of the analysis is data mining (model/algorithm selection problem). Meta-learning is a technique used for assisting non-expert users in this step. The effectiveness of meta-learning is, however, largely dependent on the description/characterization of datasets (i.e., meta-features used for meta-learning). There is a need for improving the effectiveness of meta-learning by identifying and designing more predictive meta-features. In this work, we use a method from exploratory factor analysis to study the predictive power of different meta-features collected in OpenML, which is a collaborative machine learning platform that is designed to store and organize meta-data about datasets, data mining algorithms, models and their evaluations. We first use the method to extract latent features, which are abstract concepts that group together meta-features with common characteristics. Then, we study and visualize the relationship of the latent features with three different performance measures of four classification algorithms on hundreds of datasets available in OpenML, and we select the latent features with the highest predictive power. Finally, we use the selected latent features to perform meta-learning and we show that our method improves the meta-learning process. Furthermore, we design an easy to use application for retrieving different meta-data from OpenML as the biggest source of data in this domain.

4

Intelligent Retail Forecasting System for New Clothing Products Considering Stock-out

Huang H., Liu Q.

Fibres & Textiles in Eastern Europe

|

2017

|

Vol. 25, no. 1 (121)

10--16

EN

Improving the accuracy of forecasting is crucial but complex in the clothing industry, especially for new products, with the lack of historical data and a wide range of factors affecting demand. Previous studies more concentrate on sales forecasting rather than demand forecasting, and the variables affecting demand remained to be optimized. In this study, a two-stage intelligent retail forecasting system is designed for new clothing products. In the first stage, demand is estimated with original sales data considering stock-out. The adaptive neuro fuzzy inference system (ANFIS) is introduced into the second stage to forecast demand. Meanwhile a data selection process is presented due to the limited data of new products. The empirical data are from a Canadian fast-fashion company. The results reveal the relationship between demand and sales, demonstrate the necessity of integrating the demand estimation process into a forecasting system, and show that the ANFIS-based forecasting system outperforms the traditional ANN technique.

PL

Poprawa dokładności prognozowania jest bardzo istotna, ale skomplikowana w przypadku przemysłu odzieżowego, zwłaszcza dla nowych produktów oraz szerokiego zakresu czynników wpływających na popyt. Wcześniejsze badania bardziej koncentrowały się na prognozowaniu sprzedaży, niż prognozowaniu popytu. Zmienne wpływające na popyt powinny zostać zoptymalizowane. W tym badaniu opracowano dwustopniowy inteligentny system prognozowania sprzedaży detalicznej przeznaczony dla nowych produktów odzieżowych. W pierwszym etapie, popyt jest określony za pośrednictwem oryginalnych danych dotyczących sprzedaży. Adaptacyjny neuronowy system danych rozproszonych (ANFIS) jest wprowadzony w drugim etapie do prognozowania popytu. Jednocześnie prezentowany jest proces selekcji danych. Dane empiryczne pochodzą z kanadyjskiej firmy.

5

Wykorzystanie pakietowego przekształcenia falkowego do redukcji i selekcji danych w procesie klasyfikacji sygnałów z sonaru

Przyłucki S., Pawelski W.

Elektronika : prace naukowe

|

2000

|

nr 5

51-79

PL

Praca dotyczy zagadnień redukcji i selekcji informacji w danych podawanych na wejście układu klasyfikatora. Artykuł zawiera omówienie zagadnień związanych z wykorzystaniem funkcji bazowych jako narzędzia wstępnej analizy danych. Przedstawiono skrótowe omówienia własności transformacji falkowej WT oraz jej uogólnionej wersji w postaci pakietowego przekształcenia falkowego WPT. Wskazano na wady i zalety transformacji wykorzystujących funkcje bazowe z punktu widzenia zagadnienia klasyfikacji danych pomiarowych. Wnioski z tej analizy pozwoliły na zaproponowanie nowego algorytmu wstępnej analizy danych nazwanego algorytmem LDBFS. Jest to rozwiązanie hybrydowe, które posiada własności metod wydobywania cech (zagadnienie analizy informacji zawartej w zbiorze danych pomiarowych) jak i metod selekcji cech (zagadnienie redukcji wymiaru wektora cech). Algorytm LDBFS pozwala na dowolne definiowanie cech nowych zbiorów danych powstających przez przekształcenie pierwotnych zbiorów cech. Dobierając odpowiednią dla danego zagadnienia funkcję matkę w transformacji falkowej oraz funkcję wyróżniania informacji można uzyskać efekt uwypuklenia wyłącznie danych istotnych z punktu widzenia dalszej analizy. Praca zawiera szczegółowy opis algorytmu LDBFS. Własności nowego algorytmu zostały zweryfikowane poprzez porównanie wyników klasyfikacji danych pochodzących z sonaru. Wykorzystano w tym celu dwie metody klasyczne, tj. algorytm M1NERR (selekcja cech), algorytm PCA (wyszukiwanie cech), oraz opracowany przez autorów algorytm LDBFS.

EN

The primary goal of the paper is to present the new data preprocessing method which allows the improvement of the classification process. That method, which we called LDBFS (Local Discriminant Bases with Feature Selection) is based on the wavelet packet transform. The LDBFS algorithm is a hybrid approach which consists of two main parts: feature extraction block and feature selection block. It reduces the dimensionality of data sets and maximizes a class separability for classification problems. Thanks to possibility to define the information discriminant function related to the data characteristics, the most significant features can be easily separated while the others, less important from the classification point of view, can be rejected. We tested our method using sonar dataset. That example show the superiority of our approach over classical methods (M1NERR and PCA). The comparison, presented in the paper, proves that LDBFS algorithm provide us with better insight of relationships between the essential features of inputs signals and corresponding outputs what tends to enhances the performance of any classifier.