Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl
Ograniczanie wyników
Czasopisma help
Lata help
Autorzy help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 643

Liczba wyników na stronie
first rewind previous Strona / 33 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  Data analysis
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 33 next fast forward last
XX
W artykule przedstawione są pewne nowe propozycje metod klasyfikacji mającej u podstaw model dla klasy. Są to uogólnienia klasycznego podejścia Banfielda i Raftery'ego z 1993 r" uzyskane na skutek wprowadzenia funkcji połączeń i podania algorytmów w podejściu klasyfikacyjnym i mieszankowym. (abstrakt oryginalny)
XX
Zdefiniowano współczynnik zależności prostoliniowej rozumiany jako kosinus kąta, pod jakim przecinają się proste regresji. Podobnie jak klasyczny współczynnik korelacji współczynnik zależności prostoliniowej jest asymptotycznie normalny. Tak jak w przypadku prostych regresji można zdefiniować pojęcie stożkowych regresji. Jest to przykład współczynnika zależności nieliniowej, który można określić, wychodząc od współczynnika zależności prostoliniowej. Dalej przedstawiono wielośrednią, uogólnienie klasycznego pojęcia wartości oczekiwanej zmiennej losowej. Średnia może być uważana za aproksymację średniokwadratową zmiennej losowej jednym punktem. Wielośrednia jest aproksymacją zmiennej więcej niż jednym punktem jednocześnie. Przy definiowaniu wielośredniej korzysta się ze standardowej metody momentów oraz faktów z teorii wielomianów ortogonalnych. (abstrakt oryginalny)
EN
In this paper we talk about new statistic tools which enable more precise eco¬nomic data analysis. Firstly, we define line dependent coefficient as a cosine of angle made of the cross of regression lines. It is the base, thanks to which we can define other nonlinear relation coefficients. Just like the classic correlation coefficient, line dependent coefficient is also asymptotically normal. Natural expansion of the line function class are conics. As incase of regression lines, we can define regression conics (their equations vary in lineal parts). Conic dependent coefficient is a cosine of cross angle of regression conics (we choose cross point, which is the nearest from the set of points barycentre). It is the example of non-linear dependent coefficient, which can be defined on the basis of line dependent coefficient. The second part of this article is about multiaverage, generalization of the clas¬sic expected value of the random variable idea. The average may be considered as root- mean-square average approximation of the random variable with one point. Multiaverage is approximation of the variable with more than just one point at the same time. While defining multiaverage, we use standard moments method and some facts from the orthogonal polynomial theory. (abstrakt oryginalny)
XX
W artykule przedstawiono podstawowe pojęcia związane z metodą bagging oraz metodą k-najbliższych sąsiadów dla danych symbolicznych. Zaprezentowano w nim także możliwość zastosowania podejścia wielomodelowego bagging w metodzie k-najbliższych sąsiadów dla danych symbolicznych. W części empirycznej przedstawiono zastosowanie podejścia wielomodelowego dla danych symbolicznych w przypadku przykładowych zbiorów danych wygenerowanych za pomocą funkcji cluster.Gen z pakietu cluster- Sim w programie R.(abstrakt oryginalny)
EN
The paper presents the most important basic terms of bagging and k-nearest neighbour for symbolic data. The article also presents an application of bagging ensemble for k-nearest neighbour for symbolic data.In the empirical part the application of ensemble learning for symbolic data is presented for some data sets generated by function cluster. Gen from clusterSim package of R software.(original abstract)
4
Content available remote Ocena klas w rozmytej klasyfikacji obiektów symbolicznych
100%
XX
W artykule przedstawiono propozycję oceny wyników klasyfikacji rozmytej, zawartej w pracy Machowskiej-Szewczyk [2013]. Zdefiniowano w tym celu wskaźniki ogólnej niejednorodności danych symbolicznych, heterogeniczności wewnątrz klas oraz między klasami, znaczenie każdej cechy przy tworzeniu danej klasy w klasyfikacji rozmy-tej. Praca jest kontynuacją prowadzonych wcześniej badań nad modyfikacją procedury de Carvalho i de Souza [2010], pozwalającą wykorzystać dany algorytm do utworzenia rozmytej klasyfikacji obiektów symbolicznych(abstrakt oryginalny)
EN
The aim of this work is to present the evaluation proposition of classes of fuzzy classification algorithm. For this purpose overall heterogeneity indexes of symbolic data, intra-cluster heterogeneity and between clusters heterogeneity as well as the importance of every variable in the formation of a given cluster in fuzzy classification were discussed. The work is a continuation of previous studies on the modification of Carvalho and Souza' algorithm [2010] that allows using the algorithm to create a fuzzy classification of symbolic objects.(original abstract)
5
Content available remote Zastosowania kopuli niesymetrycznych w modelowaniu ekonomicznym
100%
XX
Wielowymiarowa analiza danych ekonomicznych w wielu przypadkach musi uwzględniać fakt niewymienności badanych czynników. Taką swoistą asymetrię danych daje się modelować przy użyciu kopuli niesymetrycznych. W opracowaniu przedstawiona jest pewna procedura tworzenia dwuwymiarowych kopuli niesymetrycznych. Procedura ta zilustrowana jest analizą przykładowych danych empirycznych, w przypadku których - na podstawie stosownego testu statystycznego - uprzednio rozpoznana została asymetria. Mimo znacznej złożoności modeli bazujących na kopulach niesymetrycznych i pewnych trudności stąd wynikających, odnotować należy ich zdecydowaną przewagę w sensie większej adekwatności merytorycznej i elastyczności dopasowania w porównaniu z tradycyjnie używanymi modelami bazującymi na kopulach archimedesowych.(abstrakt oryginalny)
EN
In many cases, multidimensional analysis of economic data must take into consideration non-exchangeability of deliberated factors. Such a peculiar data asymmetry may be modelled with use of asymmetric copulas. In the paper a specific procedure of 2- dimensional asymmetric copula construction is presented and, additionally, illustrated with an analysis of exemplary empirical data, asymmetry of which was previously identified on the basis of a proper test. Despite complexity of asymmetric copula models and some further difficulties caused by them, the presented analysis reveals much higher accuracy and elasticity of asymmetric copula models in comparison with the traditional Archimedean ones.(original abstract)
XX
Jednym z najważniejszych obszarów działalności przedsiębiorstwa jest utrzymanie płynności finansowej tak w krótkim, jak i w długim okresie. Istota zapewnienia płynności finansowej wynika z faktu, iż nawet krótkotrwała utrata płynności finansowej może oznaczać niekorzystne konsekwencje dla przedsiębiorstwa. Do konsekwencji tych można zaliczyć na przykład spadek zaufania ze strony dostawców wynikający z opóźnień w spłacie zobowiązań z tytuły dostaw lub usług. Również nieregularna spłata zobowiązań wobec banków może prowadzić do zaklasyfikowania przedsiębiorstwa do niższej grupy ratingowej, co zazwyczaj skutkuje trudnościami z uzyskaniem kolejnych kredytów. Utrata płynności finansowej w dłuższym okresie w większości przypadków jest podstawową przyczyną upadłości firm. (fragment tekstu)
EN
This paper takes into consideration the implementation problem concerning data mining techniques in enterprises. In proposed approach used the fuzzyneural system that seeks the relations in data base of enterprise. It is an alternative approach as compared to the ones that have been applied so far. The example presented in this paper relates the estimation a delay in accounts receivable payment. Additional on the base the sought rules, there can try improve the liquidity level. There was proposed, how a consultant may increase the user's acceptance relative to application of data mining techniques. (original abstract)
XX
W artykule przedstawione dwa rozwiązania metodyczne (klasyczna analiza skupień i klasyfikacja spektralna) pozwalające na przeprowadzanie analizy skupień dla danych porządkowych z wykorzystaniem odległości GDM2. W części empirycznej zaprezentowane rozwiązania zastosowano do danych porządkowych z rynku nieruchomości z wykorzystaniem oprogramowania środowiska R.(abstrakt oryginalny)
EN
The article presents two methodical solutions for classification of ordinal data (classical cluster analysis and spectral clustering), based on GDM2 distance. The empirical part of the article presents clustering of ordinal data from real estate market with the application of computer programs working in R environment.(original abstract)
8
Content available remote A New Method for Calculating Mirror Data Asymmetry in International Trade
80%
EN
Research background: Some statistics are of a bilateral nature. This is how foreign trade data is organized. They are recorded both in the supplier and recipient countries, hence they are called mirror data. The data recorded at both trading partner countries are not the same for different reasons. Such differences between data on the same groups of transactions are often referred to as the asymmetry of mirror data. The information about the value of the flows of goods are of great importance in economic analyses and therefore their quality is particularly important.Purpose of the article: The aim of this paper is to present a new measure of data asymmetry - the aggregated quantity index with value-based weights.Methods: The proposed measure combines the quantity and the value of turn-over in individual trade relations. Such a measure makes it possible to eliminate basic deficiencies in value-based measures, while considering the specificity of trade in individual countries. The proposed measure of data asymmetry was confronted with several measures present in the literature and previously used by the Authors. The numerical example uses Comext data on intra-Community trade in 2017 provided by Eurostat.Findings & Value added: The proposed measure performs better than all the previously used data asymmetry indices. It is to some extent immune to exchange rate differences and inconsistencies resulting from the inclusion of transport and insurance costs in the value of goods. In addition, it gives lower weights to unimportant trade directions than other data asymmetry indices. Since the new index has proved to be better than the measures previously used, it is worth applying to those trade relations where the data are not de-rived from customs documents, but from declarations made by businesses, as in the case of intra-Community trade. (original abstract)
9
Content available remote Zagadnienia społeczne i prawne w koncepcji big data
80%
XX
Popularny w ostatnim czasie termin big data dopiero się kształtuje i na chwilę obecną obejmuje dość szeroki zakres pojęciowy. Autor opierając się na tematyce publikowanych w ostatnim okresie w polskich gazetach artykułów, które wykorzystywały omawiane pojęcie, dokonał próby charakterystyki powszechnego zrozumienia terminu big data. Wyniki tego badania pozwalają na stwierdzenie, że powszechnie pod tym terminem rozumie się w szczególności problematykę prywatności i zagrożenia permanentną inwigilacją, jako konsekwencję możliwości masowego przetwarzania danych. Tak więc, mimo że ogólnie przyjęte wyjaśnienie terminu big data opiera się na aspektach technologicznych metod przetwarzania danych masowych, odbiega ono znacząco od powszechnego jego odbioru. Zagadnienia związane z problemami przetwarzania przede wszystkim różnego typu danych osobowych określone zostały w artykule jako społeczny aspekt big data. Jest on ściśle związany z zagadnieniami prawnymi, gdyż prawo, usiłując nadążyć za postępem technologicznym i potrzebami biznesu, próbuje określić dopuszczalne granice przetwarzania danych. Zagadnienia społeczne i prawne w koncepcji big data są podstawowym tematem artykułu. (abstrakt oryginalny)
EN
The term big data is very popular recently. The concept is new and is shaping up. The author conducted a study into the usage of the term big data in popular media. Generally, the analyzed texts focused mainly on the danger of surveillance and the threats to privacy resulting from the analysis of web content, including social networks, by the private sector. This is a social aspect of big data. The paper proposes a three-faceted explanation of the term, by distinguishing three basic aspects of big data: technological (including the opportunities offered by IT and modern analytical methods), business (including a variety of applications of the concept) and social (focusing on the consequences of its implementation). Nonetheless the paper is focused on the social aspect - the risks associated with the mass processing of personal data. It is related to an additional legal subaspect. The social aspect with the legal sub-aspect are dependent in relation to the other aspects: technological and business. (original abstract)
XX
Głównym problemem w eksploracyjnej analizie czynnikowej jest określenie liczby czynników wspólnych, które wystarczająco wyjaśniają korelację między obserwowalnymi. Istnieje kilka zasad określania liczby czynników głównych, stosowanych w eksploracyjnej analizie czynnikowej. W artykule przedstawiono najważniejsze z nich: 1) kryterium istotności testu statystycznego, 2) kryterium bazujące na wartościach własnych, 3) kryterium połowy, 4) kryterium osypiska (scree plot), 5) kryterium wyjaśnionej wariancji, 6) kryterium heurystyczne.W opisie każdej z tych metod wskazano jej wady i zalety oraz warunki stosowania. W końcowej części artykułu przedstawione kryteria zobrazowano na przykładzie empirycznym dotyczącym rynku kawy. (fragment tekstu)
EN
The major problem in factor analysis is to determine number of factors, which can adequately explain the observed correlations (or covariances) among the observed variables. There are several major methods of determining number of factors:• Significance Tests,• Eigenvalue Specification,• Scree-Test,• Criterion of Substantive Importance.The idea of the article characterised methods of determining number of factors with their advantage and disadvantage, and describes empirical example to apply to coffee market. (original abstract)
XX
Wiele wielowymiarowych zbiorów danych ma strukturę sugerującą wykorzystanie analizy MANOVA, jednakże nie spełniają jej wymaganych założeń. Od niedawna zainteresowanie wzbudza analogiczny typ analizy, przeprowadzanej jednak na macierzy niepodobieństw otrzymanej z nieprzetworzonych danych. Niniejsza praca zawiera przegląd podstaw takiego podejścia, pokazuje główne etapy takiej analizy. Zaprezentowano również, w jaki sposób biploty i analiza wrażliwości mogą być dodane do metody podstawowej, a także ilustruje przedstawione pojęcia za pomocą zbioru danych pochodzących z ekologii. (abstrakt oryginalny)
EN
This has been a necessarily brief review, but the hope is that sufficient detail has been provided for the reader to be able to apply the various analyses that have been outlined to other data sets. However, some cautionary points need to be borne in mind at all stages. Most descriptive analyses rely on just two-dimensional graphical displays, and these should always be first checked for adequacy using any of the standard MDS measures (e.g. STRESS, proportion of eigenvalues to trace, etc). The variability inherent in multidimensional scalings should also be remembered, and when comparing two MDS diagrams the arbitriness of signs of axes should be allowed for (see [Krzanowski 2006] for suggestions). In breaking effects down into single degrees of freedom, care should be taken over choosing appropriate H matrices. Finally, if biplots are computed it should be remembered that the linearity is only an approximation; residual sums of squares from the least squares fitting will give an indication as to how close the approximation really is. If these cautionary points are attended to, then the methods surveyed above should provide useful analyses in many situations. (fragment of text)
XX
Celem niniejszego artykułu jest zaprezentowanie idei symbolicznej klasyfikacji opartej na kryteriach (criterion-based divisive clustering). Metodą ta została zaproponowana przez M. Chavent. W swych założeniach metoda pozwala albo na klasyfikację obiektów, które opisane są zmiennymi w postaci przedziału liczbowego czy innych "silnych skal" pomiaru, albo na klasyfikację obiektów opisanych zmiennymi w postaci listy kategorii czy listy kategorii z wagami. Natomiast z powodu zastosowanej w niej miary jakości klasyfikacji nie pozwala na klasyfikację obiektów opisanych różnymi typami zmiennych łącznie. Dlatego też dodatkowym celem niniejszego opracowania jest pokazanie modyfikacji tej metody, która pozwala na klasyfikację obiektów opisanych przez zmienne dowolnego typu. W części empirycznej porównano wyniki klasyfikacji uzyskane metodą niezmodyfikowaną i zmodyfikowaną na przykładzie rynku samochodowego. (fragment tekstu)
EN
The aim of this article is to present one of symbolic clustering methods, the criterion-based divisive clustering method, besides that article presents a modification of this method that will allow to clustering symbolic objects with different variable types. The article will compare in the empirical part the clustering of a car market with modified and unmodified method. (original abstract)
XX
Podstawowe zadanie WAP to porównywanie (głównie porządkowanie) obiektów ze względu na nieobserwowalne bezpośrednio zjawisko złożone (np. poziom życia czy kondycję finansową firmy). Wyniki porównywania obiektów zależą od wyboru cech opisujących obiekty. W pracy Hellwiga [1995] wskazywano na możliwość stosowania macierzy korelacji w formalnej ocenie zbioru cech. W niniejszym artykule podano dwa formalne kryteria i wprowadzono dwie klasy miar, które można wykorzystać do formalnej oceny danych, będących podstawą rankingu obiektów. Miary są tworzone na podstawie macierzy korelacji cech diagnostycznych oraz odpowiednio określonych wag cech. (fragment tekstu)
EN
In this article there are described two classes of measures based on the correlation matrix of diagnostic variables. Low measures values can warn that the results of objects comparison and ranking can be irrelevant even though the variables seem to be properly chosen on the merits of the case. Low values can also be a reason to apply partial criteria of objects ranking. (original abstract)
XX
Termin wstępna analiza danych (exploratory data analysis - EDA) po raz pierwszy użyty w 1977 r. przez J. Tukeya oznacza wykorzystanie różnych technik analizy danych, zwłaszcza graficznych, w celu umożliwienia "wglądu w dane", odkrycia ukrytych w nich struktur, wyznaczenia istotnych zmiennych, detekcji obserwacji nietypowych. Wstępną analizę danych stosuje się od pewnego czasu w procesie zgłębiania danych (data mining), będącego elementem pozyskiwania wiedzy z baz danych (knowledge discovery in databases - KDD). Z powodu ogromnej ilości danych zastosowanie metod statystycznej analizy danych SAD jest wówczas utrudnione. Stosuje się je zazwyczaj w celu weryfikacji wyników otrzymanych po przeprowadzeniu wstępnej analizy. (fragment tekstu)
EN
This paper describes some differences between Exploratory Data Analysis and Statistical Data Analysis. The advanced projection technics of Kohonen's Self Organizing Maps is used for measuring the life quality in Polish districts. (original abstract)
XX
W niniejszym opracowaniu została zaprezentowana koncepcja systemu analizy rynku papierów wartościowych oparta na technologii inteligentnych agentów. Opracowane podejście czyni możliwym połączenie różnych metod analizy danych finansowych w jeden efektywny system wspomagania decyzji giełdowych. Po krótkim przeglądzie technologii inteligentnych agentów z perspektywy cech agenta, który posiada wiedzę, umiejętność wnioskowania i zdolność uczenia się, uszczegółowiono strukturę funkcjonalną zaproponowanego systemu. (abstrakt oryginalny)
EN
In this paper, an approach to stock market analysis based on the modern technology of intelligent agents has been proposed. The most significant advantage of the system is the possibility of joining the power of different analyzing methods such as genetic algorithms, neural networks, statistical analysis, and text mining. The preliminary tests have shown that the approach is rather promising and it seems to be efficient.Further tests are needed to verify the approach efficiency and develop a proper parameters set. Moreover, additional agents may be introduced in order to improve the quality of results and increase the accuracy of the prediction. An additional effort is needed to work out the optimal system structure and cinfiguration. (fragm. tekstu) ??(fragment of text)
XX
Pojedyncze klasyfikatory często nie dają satysfakcjonujących wyników, głównie z powodu trzech ograniczeń, a mianowicie: statystycznego, obliczeniowego oraz reprezentacyjnego. Jednym z proponowanych rozwiązań są klasyfikatory złożone, których idea polega na definiowaniu wielu zadań uczenia w ramach jednego pliku uczącego. Klasyfikator taki otrzymuje się, manipulując plikiem uczącym lub mechanizmem sterowania w algorytmie uczącym. Celem niniejszego artykułu jest zdefiniowanie różnych zadań uczenia poprzez manipulację etykietami przykładów, z zastosowaniem kontekstów danych uczących.Jego kolejne rozdziały to wprowadzenie do problematyki klasyfikatorów złożonych ze wskazaniem możliwych modyfikacji ich tworzenia, propozycja rozwiązań i wyniki wstępnych badań oraz podsumowanie wyników. (fragment tekstu)
EN
Ensemble methods are the means for difficult learning task in supervised learning. The idea is to construct a collection Of individual classifiers on the basis of one learning set. This task can be accomplished by manipulation of data set or control mechanism of learning algorithm. This paper proposal is defining different learning task using context inserted in data set by manipulating the output targets. (original abstract)
17
80%
XX
Celem artykułu jest zaprezentowanie propozycji adaptacji analizy unfolding dla danych symbolicznych. W tekście scharakteryzowano podstawowe pojęcia związane z analizą unfolding i danymi symbolicznymi. Przedstawione zostały dwa podejścia - wewnętrzne - hybrydowe, i zewnętrzne - symboliczno-numeryczne. W części empirycznej przedstawiono wyniki zastosowania podejścia zewnętrznego - symboliczno-numerycznego - na przykładzie danych dotyczących monitorów LCD. Na użytek obliczeń przygotowano kody źródłowe programu R.(abstrakt oryginalny)
EN
The aim of this paper is to propose and present adaptations of unfolding analysis for symbolic data. In the article, the basic terms of unfolding analysis and symbolic data are presented. The paper presents two approaches - the internal hybrid approach and the external symbolic-numeric approach. In the empirical part, the external symbolic-numeric unfolding for LCD brands is presented. Symbolic multidimensional scaling R source codes were written by authors.(original abstract)
XX
Istniejące systemy Business Intelligence (BI) są wykorzystywane do przeprowadzania różnorodnych analiz ekonomicznych we wszystkich podstawowych obszarach działalności przedsiębiorstwa, takich jak finanse, produkcja, logistyka, marketing, sprzedaż. Programy te dostarczają wielu różnorodnych raportów zawierających dane o wskaźnikach ekonomicznych. Ich analiza służy do badania i oceny funkcjonowania przedsiębiorstwa. Aby poprawnie zinterpretować wskaźniki ekonomiczne, są potrzebne nie tylko ich wartości, ale również wiedza dotycząca różnorodnych relacji i zależności istniejących pomiędzy nimi. Dlatego kadra kierownicza oczekuje, iż w sposób interaktywny będzie pozyskiwać potrzebne informacje powiązane ze sobą kontekstowo. Jest to jedna z przyczyn zastosowania nowych technologii (w tym wyszukiwania semantycznego) w systemie BI. Celem niniejszego artykułu jest wskazanie możliwości zastosowania interaktywnego wyszukiwania informacji na bazie wizualizacji sieci semantycznej w mapie pojęć, jako rozwiązania analitycznego w nowej generacji systemów BI. W związku z tym krótko scharakteryzowano standard mapy pojęć w kontekście wyszukiwania semantycznego. Przedstawiono cechy nowej generacji systemów BI. Omówiono także przesłanki zastosowania standardu mapy pojęć w systemach BI, koncentrując się na wizualnym wyszukiwaniu informacji. (fragment tekstu)
EN
The main contribution of this work is the demonstration of the reasons of using visual searching in topic map (TM) in Business Intelligence (BI) system. This can be an important step towards using the semantic search in BI. The article is structured as follows. In section 1 topic map standard (TM) and semantic search are presented. In section 2 development of BI system towards Business Intelligence 2.0 is discussed. In section 3 the reasons of using TM in the BI system are illustrated. Finally, in the last section, the conclusions of this work is given. (original abstract)
19
Content available remote Próba konstrukcji wskaźników złożonych w testach koniunktury
80%
XX
Wskaźniki złożone w testach koniunktury są zazwyczaj konstruowane w sposób arbitralny. W artykule przedstawiono sposób konstrukcji wskaźników złożonych z wykorzystaniem informacji zawartych w danych. Rozważania przedstawiono na przykładzie badań ankietowych prowadzonych przez GUS w przemyśle przetwórczym. (original abstract)
EN
The composite indicators in economic tests are usually constructed in an arbitrary way. The paper presents the method of the construction of composite indicators with the usage of the information included in the data. The considerations are presented with the help of surveys by GUS (Central Statistical Office of Poland) in processing industry. (original abstract)
XX
Celem tego artykułu będzie przedstawienie jednej z metod służących do estymacji (oszacowania) wartości cech ukrytych. (fragment tekstu)
EN
This article presents the latent trait models. It describes how to use the Rasch model to estimate student's ability and item difficulty. The author defines the problem and describes how to build such model. The main method which was used to find the parameter estimators is the maximum likelihood method. Next, the author ilustrates how to use this model when we have some data. Finally, the author focuses on graphic method of verification of that model. (original abstract)
first rewind previous Strona / 33 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.