Obecnie trudno wyobrazić sobie jakąkolwiek instytucję, przedsiębiorstwo lub placówkę społeczną, która byłaby w stanie sprawnie funkcjonować bez obszernej bazy skomputeryzowanych danych. Niesie to za sobą konieczność analizy oraz przetwarzania dużych zbiorów danych. Ponadto oczekujemy szybkich wyników, przedstawionych w maksymalnie skompresowany, zwięzły sposób, zrozumiały dla szerokiego grona odbiorców. Z pomocą przychodzą podsumowania lingwistyczne relacyjnych baz danych, czyli zdania w języku naturalnym opisujące znaczenie wybranych danych, np. Około połowa [badanych] dzieci to chłopcy. Większość dziewczynek w wieku wczesnoszkolnym, w odniesieniu do chłopców, jest wysokiego wzrostu. Zastosowanie podsumowań lingwistycznych może znacząco usprawnić proces zarządzania wiedzą. Za pomocą odpowiednich algorytmów można pozyskać wiedzę na temat zbioru danych w postaci intuicyjnego komunikatu w języku naturalnym. Dzięki zastosowaniu nieprecyzyjnych wyrażeń liczbowych, takich jak większość, wysoki wzrost, wiek wczesnoszkolny, otrzymuje się komunikat bardziej przyjazny i zrozumiały, bez konieczności posiadania dodatkowej wiedzy na temat analizowanych danych, ponieważ jest wyrażony językiem naturalnym, a nie liczbami, przez co staje się on komunikatywny i czytelny dla statystycznego odbiorcy. Jeżeli w powyższym przykładzie użytoby precyzyjnych liczb, np. 5679 dziewczynek w wieku od 7 do 12 lat, w odniesieniu do chłopców, jest wzrostu od 153 do 165 cm, komunikat mógłby stać się niejasny dla osoby nieposiadającej wiedzy na temat analizowanych danych. Jak łatwo zauważyć, taki komunikat nie daje żadnej praktycznej wiedzy na temat danych użytkownikowi, który nie wie ile jest dziewczynek w analizowanej bazie (nie można określić jaką część zbioru dziewczynek stanowi liczba 5679), jaką część Pozyskiwanie wiedzy z relacyjnych baz danych... 297 stanowią dzieci w wieku od 7 do 12 lat oraz czy przedział 153-165 cm traktować jako średni wzrost, czy może już wysoki. Niewymagane są żadne operacje wstępne, takie jak np. sprawdzenie podstawowej wiedzy na temat danych, a zatem z metody tej mogą korzystać wszyscy użytkownicy, również nieposiadający wiedzy z zakresu informatyki, a jedynie umiejętność obsługi komputera. Zastosowanie tej metody skutkuje wzrostem jakości otrzymywanej wiedzy, ponieważ eliminuje błędy ludzkie oraz wynikające z zastosowania bardzo skomplikowanych i złożonych algorytmów, przy jednoczesnym skróceniu czasu, jaki byłby potrzebny na analizę obszernej bazy danych innymi metodami. Jest to krok w kierunku interfejsów naturalnych, przyjaznych użytkownikowi, gdyż opartych na języku naturalnym. Celem pracy jest przedstawienie możliwości analizy dużych zbiorów danych za pomocą logiki rozmytej oraz zaprezentowanie wyników tej analizy za pomocą języka naturalnego. (fragment tekstu)
EN
The aim of this article is to show how fuzzy logic based algorithms can be applied to analyze large datasets and present its results in a human-friendly form: using natural language. A new concept of linguistic summaries is demonstrated: multi-subject linguistic summaries of relational databases, that extends the classic manner. This paper focuses on new, interesting forms of linguistic summaries, which are represented by equations (4), (11), (15) and (18). This article also contains discussion about calculating degrees of truth of the new forms. From the potential end user point of view simplified form of presenting results using natural language expressions is the most important thing. This paper includes demonstration and description of standalone application that generates analysis of large dataset and presents results using short and intuitive expressions in natural language. Possibilities given by the multi-subject linguistic summaries, e.g. description and comparison of more than one subject in one summarization, makes them great extension and complementation of existing forms of linguistic summaries. (original abstract)
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Do przetwarzania analitycznego (OLAP) wykorzystywane są różnorodne systemy zarządzania bazami danych. W praktyce technologie analizy wielowymiarowej wspierają specjalizowane rozwiązania MOLAP, jaka również najpopularniejsze systemy zarządzania relacyjnymi bazami danych. Stosowane rozwiązania na rynku aplikacji wspomagających decyzją mają różną podatność na niekontrolowany wzrost objętości bazy będący następstwem tworzenia agregatów danych. (abstrakt oryginalny)
EN
Differentiated Data Base Management Systems are used for realization of analytical processing systems (OLAP). In practice multidimensional analysing technologies support specialised MOLAP solutions and also the most popular relational data base management systems. Solutions used at market of decision support applications have different susceptibility for not controlled growth in data base being result of creation of data aggregates. (original abstract)
The present work introduces the scholarly community to a database containing information about the invalids, orphans, and widows of the First World War in Transylvania - the IOW database, which uses data extracted from the files relating to pensions awarded to these social categories as its main sources. These consist primarily of civil status documents, reports on the personal characteristics of the enrolled soldiers, data relating to war participation and testimonies proving disappearance or death in addition to medical records, as well as information regarding the situations of the beneficiaries' families and the amounts of money they received, and evidence attesting changes in the status of pension beneficiaries. Next, the details were entered into a relational data-base that will enable multiple scientific investigations in the fields of humanities, social sciences, and legal studies, as well as medicine and history of medicine, and offer the possibility of having a social and cultural impact among the general public and local communities. The preliminary results, drawn from the table relating to widows, illustrate the negative consequences of war on the lives of men, women, and children in Transylvania. Finally, the paper outlines further development of the database and future lines of research.(original abstract)
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.