In the paper, the possibility of ConceptNet application for knowledge management of texts in the Polish and English language is discussed. ConceptNet is a freely-available semantic network, designed to help computers understand the meanings of words that people use, it contains concepts from many languages. The semantics of ConceptNet is presented in the context of the semantics of the EuroVoc which is based on the SKOS standard. Indexing tool, created by authors, based on ConceptNet is briefly described. Tests of texts indexing with the use of papers in Polish and English language were performed. Results are analyzed and evaluated. At the end, some conclusions about the quality of results are formulated.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Highly structured knowledge bases such as lexical semantic networks contain various connectivity patterns that can be learned as node features using dedicated frameworks. However, semantic relations are often unequally distributed over such knowledge resources. Some of the language partitions may benefit from integrating structured resources which are more easily available for resource-rich languages. In the present paper, we propose a simple endogenous method for enhancing a multilingual knowledge base through the cross-lingual semantic relation inference. It can be run on multilingual resources prior to semantic representation learning. Multilingual knowledge bases may integrate preexisting structured resources available for resource-rich languages. We aim at performing cross-lingual inference on them to improve the low resource language by creating semantic relationships.
3
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Context is widely considered for NLP and knowledge discovery since it highly influences the exact meaning of natural language. The scientific challenge is not only to extract such context data, but also to store this data for further NLP approaches. Here, we propose a multiple step knowledge graph based approach to utilize context data for NLP and knowledge expression and extraction. We introduce the graph-theoretic foundation for a general context concept within semantic networks and show a proof-of-concept based on biomedical literature and text mining. We discuss the impact of this novel approach on text analysis, various forms of text recognition and knowledge extraction and retrieval.
4
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
W pracy przedstawiono podstawowe zasady budowy i nauczania sieci neuronowej głebokiego zaufania do określenia semantycznie ważnych oznak na podstawie próbki CIFAR-10. Dla przygotowania do nauki sieci neuronowej głębokiego zaufania stosuje się opracowane podejście na podstawie minimalizacji błędu rekonstrukcyjnego obrazów widocznych i ukrytych dla ograniczonej maszyny Boltzmanna (RBM).
EN
The main principles of construction and learning deep belief neural networks for extraction valuable semantic features are proposed. The proposed approach is based on minimization of reconstruction mean square error, which we can obtain using a simple iterations of Gibbs sampling.
The research described in the article refers to the study of data from the domain of medicine. The diagnostic test results are recorded in different ways. They may take the form of tables, graphs or images. Regardless of the original data format, it is possible to draw up their verbal description, which focuses on the description of the observed symptoms. Such descriptions make up the text corpora concerning individual diagnostic technologies. Knowledge on disease entities is stored in a similar manner. It has the form of text corpora, which contain descriptions of symptoms specific to individual diseases. By using natural language processing tools semantic models can be automatically extracted from the texts to describe particular diagnostic technologies and diseases. One of the obstacles is the fact that medical knowledge can be written in a natural language in many ways. The application of the semantic format allows the elimination of record ambiguities. Ultimately, we get a unified model of medical knowledge, both from the results of diagnostic technologies describing the state of the patient and knowledge of disease entities. This gives the possibility of merging data from different sources (heterogeneous data) to a homogeneous form. The article presents a method of generating a semantic model of medical knowledge, using lexical analysis of text corpora.
PL
Opisane w artykule badania dotyczą danych z dziedziny medycyny. Wyniki badań diagnostycznych rejestrowane są na różne sposoby. Mogą mieć postać tabel, wykresów, obrazów. Niezależnie od oryginalnego formatu danych możliwe jest sporządzenie ich opisu słownego, który koncentruje się na opisie zaobserwowanych objawów chorobowych. Opisy takie tworzą korpusy słowne dotyczące poszczególnych technologii diagnostycznych. W podobny sposób zapisywana jest wiedza dotycząca jednostek chorobowych. Ma ona postać korpusów tekstowych, w których zawarte są opisy objawów specyficznych dla poszczególnych schorzeń. Posługując się narzędziami przetwarzania języka naturalnego, możliwe jest automatyczne wydobycie z tekstów modeli semantycznych opisujących poszczególne technologie diagnostyczne oraz choroby. Pewne utrudnienie stanowi fakt, że wiedza medyczna może zostać zapisana w języku naturalnym na wiele sposobów. Zastosowanie formatu semantycznego pozwala wyeliminować te niejednoznaczności zapisu. W konsekwencji dostajemy ujednolicony model wiedzy medycznej, zarówno od strony wyników technologii diagnostycznych opisujących stan pacjenta, jak i wiedzy dotyczącej jednostek chorobowych. Daje to możliwość dokonania fuzji danych pochodzących z różnych źródeł (danych heterogenicznych) do postaci homogenicznej. Artykuł przedstawia metodę generowania modelu semantycznego wiedzy medycznej wykorzystującą analizy leksykalne korpusów słownych.
Contemporary research and production activity require searching and collecting a variety of information, this also applies to issues in the field of agriculture. Today, the vast majority of resources are available in a digital form. FAO on the portal of the Agricultural Information Management Standards presents an AgroTagger, tool for indexing documents in the field of agriculture, which is designed for the English language. Extraction of knowledge is not very convenient in languages such as Polish language with a very extensive inflection. In Polish, the following parts of speech inflect: verbs, nouns, numerals, adjectives, and pronouns. Proper indexing requires an initial reduction of grammatical forms, to which the authors have used the dictionary of the Polish language and have developed a programme of reducing. Moreover the algorithms for determining weights corresponding to the validity of the appointments taking into account the prevalence of terms and their position in the document were developed and implemented.
PL
Współcześnie działalność badawcza i produkcyjna wymaga wyszukiwania i gromadzenia różnorodnych informacji, dotyczy to także zagadnień z dziedziny rolnictwa. Obecnie większość zasobów dostępna jest w formie cyfrowej. FAO w ramach portalu Agricultural Information Management Standards prezentuje AgroTagger narzędzie do indeksowania dokumentów z dziedziny rolnictwa, które przeznaczone jest dla języka angielskiego. Ekstrakcja wiedzy jest utrudniona w językach takich jak język polski, posiadających bardzo rozbudowaną fleksję. W języku polskim odmienia się rzeczowniki, czasowniki, przymiotniki oraz zaimki osobowe. Właściwa indeksacja wymaga wstępnej redukcji form fleksyjnych, wobec czego wykorzystano słownik odmian języka polskiego i opracowano program redukujący. Ponadto opracowano i zaimplementowano algorytmy wyznaczania wag odpowiadających ważności terminów uwzględniające częstość występowania terminów i ich pozycję w dokumencie.
This paper discusses the issues related to the diagnostic reasoning in diagnosis processes where fuzzy knowledge appear. It is proposed to use a semantic network to describe this knowledge.
The main goal of this paper is to discuss the research on heuristic evaluation of visualization in the semantic search of economic information. It is already the fourth experiment with participants. This time in the research we used two applications built in Protégé 4.1: for analysis of Return on Investment (ROI) indicator according to Du Pont model and for multidimensional early warning system. In the article we briefly described semantic networks as visual interface and premises of conducted study. Then we analysed and compared results of these experiments. Finally, we presented conclusions.
Artykuł prezentuje formalizm sieci semantycznej oparty na logice ramek. Zadanie wyznaczania uprzywilejowanych tras stanowi pole wykorzystania zaawansowanych technik opracowania dynamicznych modułów, rozszerzeń HiLog i logiki transakcyjnej. Opracowany dedukcyjny program implementowany jest z użyciem silnika wnioskowania FLORA-2, który pozwala na wykonywanie skalowalnych zapytań. Artykuł kończy się omówieniem rozszerzeń systemu i prezentacja kierunków dalszych badań.
EN
The paper presents a semantic network formalism based on frame logic. Advanced techniques, including HiLog extensions, transaction logic and dynamic module creation are applied to the problem of preferential routing and rerouting. The deductive program is implemented in the FLORA-2 reasoning engine, which allows the scalable query execution. Finally, possible extensions to the system and guidelines for a future research are presented.
Wyszukiwana w sieciach semantycznych wiedza, potrzebna do sterowania obiektami, jest najczęściej wiedzą rozmytą. Do opisu tej wiedzy można wykorzystać język rozmytej logiki opisowej fuzzyDL. W pracy zdefiniowano układ dynamiczny (sterowany) wyszukujący wiedzę rozmytą w sieciach semantycznych przy ustalonej interpretacji wyrażeń języka tej logiki.
EN
Knowledge, searched in the semantic networks, which is used to control objects, is often fuzzy knowledge. To describe this knowledge we can use the attribute language of the Fuzzy Description Logic (fuzzyDL). In this paper we define a dynamic, controlled system searching fuzzy knowledge in the semantic networks using the fuzzyDL language.
Opisane w artykule badania dotyczą danych z dziedziny medycyny. Wyniki badań diagnostycznych rejestrowane są na różne sposoby. Mogą mieć postać tabel, wykresów, obrazów. Niezależnie od oryginalnego formatu danych możliwe jest sporządzenie ich opisu słownego, który koncentruje się na opisie zaobserwowanych objawów chorobowych. Opisy takie tworzą korpusy słowne dotyczące poszczególnych technologii diagnostycznych. W podobny sposób zapisywana jest wiedza dotycząca jednostek chorobowych. Ma ona postać korpusów tekstowych, w których zawarte są opisy objawów specyficznych dla poszczególnych schorzeń. Za pomocą narzędzi przetwarzania języka naturalnego możliwe jest automatyczne wydobycie z tekstów modeli semantycznych, opisujących poszczególne technologie diagnostyczne oraz choroby. Pewne utrudnienie stanowi fakt, że wiedza medyczna może zostać zapisana w języku naturalnym na wiele sposobów. Zastosowanie formatu semantycznego pozwala wyeliminować te niejednoznaczności zapisu. W konsekwencji dostajemy ujednolicony model wiedzy medycznej, zarówno od strony wyników technologii diagnostycznych opisujących stan pacjenta, jak i wiedzy dotyczącej jednostek chorobowych. Daje to możliwość dokonania fuzji danych pochodzących z różnych źródeł (danych heterogenicznych) do postaci homogenicznej. Artykuł przedstawia metodę generowania modelu semantycznego wiedzy medycznej, wykorzystującą analizy leksykalne korpusów słownych.
EN
The research described in article refers the medical data. Descriptions of diagnostic technologies results and descriptions of diseases form the text corpus. The corpus is the basis for building a semantic model of symptoms. A specific symptom can be written in the natural language in many ways, which is a problem for further processing of such information. There is a need to record symptoms in a uniform format. Such format allows for application of the same methods and mathematical tools to support the process of diagnosis. The paper presents method of generating a semantic model based on text corpus. Construction of the model is a part of the research, which aims to make the fusion of data from different sources (heterogeneous data) into homogeneous form.
In this paper, which is the continuation of an MCC 2006 Conf. publication by the same group of authors, we propose a concept of early detection of terrorist action preparation activities. Our ideas rely on semantic and complex networks to extract useful information for terrorist threat indication. Presented methods will be used as a core framework for Early Warning System.
Artykuł zawiera informacje dotyczące najnowszych technologii internetowych, które w niedalekim czasie umożliwią przemianę istniejącej sieci WWW w Internet następnej generacji. Przedstawione zostały problemy związane z wyszukiwaniem i integracją informacji oraz możliwości ich eliminowania z wykorzystaniem sieci semantycznych. Omówione zostało pojęcie ontologii oraz oceniona perspektywa zastosowań inteligentnego oprogramowania w nowych technologiach informacyjnych.
EN
The paper contains the information about the newest internet technology, that is indented to change in the short time an existing www by the www of next generation. The problems regarding information founding and integration will be highlighted. Also will be shown the possibilities of elimination those problems using the semantic networks. The concept of ontology will be discussed; the perspectives of use of intelligent software at the new information technologies will be estimated.
In the presented paper, a knowledge-based method for extraction of GIS (geographical information system) objects form scanned Polish Fundamental Map is proposed. The described method of map interpretation is fully model-based, that means both the description of the objects and the interpretation strategy are based on a model. The model of objects and their relationships is a four-level semantic network comprising the following levels: 1) a binary image, 2) a vector graph, 3) graphics and text and 4) topographic objects. The proposed interpretation strategy which is independent of the application, is an integrated top-down and bottom-up method which is extended by the so-called mixed reasoning strategy to be able to make inferences based on intermediate results, thus to guide the interpretation in promising directions. Additionally, we propose to enhance the control of the interpretation process by including the inconsistency detection step in one interpretation cycle during which the current interpretation result is checked using two kinds of the defined relationships between topographic objects: necessary and negative ones. The proposed method can be incorporated into systems for automatic map interpretation that are used in practice.
PL
W pracy przedstawiona została metoda automatycznej ekstrakcji obiektów tworzących GIS (geograficzny system informacyjny) z zeskanowanej mapy zasadniczej kraju. Prezentowana metoda jest przykładem metody w pełni opartej na modelu, tzn. zarówno opis obiektów oparty jest na modelu (sieć semantyczna), jak również algorytm interpretacji, który jest niezależny od aplikacji. Zaproponowano 4-poziomowy model sieci semantycznej zawierający następujące poziomy: 1) obraz binarny, 2) graf wektorowy, 3) grafika i tekst, 4) obiekty topograficzne. Zaproponowana strategia interpretacji stanowi połączenie podejść: z góry do dołu i z dołu do góry., rozszerzone o tzw. Mieszany mechanizm wnioskowania, tak aby można było sterować procesem interpretacji w zależności od bieżących wyników interpretacji. Dodatkowo, włączono w cykl interpretacji etap detekcji niespójności w uzyskanym wyniku interpretacji wykorzystując do tego dwa typy zdefiniowanych relacji między obiektami topograficznymi: "konieczne" i "wykluczające się". Prezentowana metoda może znaleźć zastosowanie w komercyjnych systemach automatycznej interpretacji map.
15
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
We elaborate on the semantics of an enhanced object-oriented semantic network, where multiple instantiation, multiple specialization, and meta-classes are supported for both kinds of objects: entities and properties. By semantics of a semantic network, we mean the information (both explicit and derived) that the semantic network carries. Several data models use semantic networks to organize information. However, many of these models do not have a formalism defining what the semantics of the semantic network is. In our data model, in addition to the Isa relation, we consider a stronger from of specialization for properties, that we call restriction Isa, or Risa for short. The Risa relation expresses property value refinement. A distinctive feature of our data model is that it supports the interaction between Isa and Risa relations. The combination of Isa and Risa provides a powerful conceptual modeling mechanism. The user declares objects and relations between objects through a program. Reasoning is done through a number of (built-in) inference rules that allow for derivations both at instance and schema level. Through the inference rules, new objects and new relations between objects are derived. In our data model, inherited properties are considered to be derived objects. In addition to the inference rules, a number of (built-in) system constraints exist for checking the validity of a program.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.