PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Automatyczna budowa semantycznego modelu objawów chorobowych na bazie korpusu słownego

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Automatic construction of a semantic model of disease symptoms based on text corpus
Języki publikacji
EN
Abstrakty
EN
The research described in article refers the medical data. Descriptions of diagnostic technologies results and descriptions of diseases form the text corpus. The corpus is the basis for building a semantic model of symptoms. A specific symptom can be written in the natural language in many ways, which is a problem for further processing of such information. There is a need to record symptoms in a uniform format. Such format allows for application of the same methods and mathematical tools to support the process of diagnosis. The paper presents method of generating a semantic model based on text corpus. Construction of the model is a part of the research, which aims to make the fusion of data from different sources (heterogeneous data) into homogeneous form.
PL
Opisane w artykule badania dotyczą danych z dziedziny medycyny. Wyniki badań diagnostycznych rejestrowane są na różne sposoby. Mogą mieć postać tabel, wykresów, obrazów. Niezależnie od oryginalnego formatu danych możliwe jest sporządzenie ich opisu słownego, który koncentruje się na opisie zaobserwowanych objawów chorobowych. Opisy takie tworzą korpusy słowne dotyczące poszczególnych technologii diagnostycznych. W podobny sposób zapisywana jest wiedza dotycząca jednostek chorobowych. Ma ona postać korpusów tekstowych, w których zawarte są opisy objawów specyficznych dla poszczególnych schorzeń. Za pomocą narzędzi przetwarzania języka naturalnego możliwe jest automatyczne wydobycie z tekstów modeli semantycznych, opisujących poszczególne technologie diagnostyczne oraz choroby. Pewne utrudnienie stanowi fakt, że wiedza medyczna może zostać zapisana w języku naturalnym na wiele sposobów. Zastosowanie formatu semantycznego pozwala wyeliminować te niejednoznaczności zapisu. W konsekwencji dostajemy ujednolicony model wiedzy medycznej, zarówno od strony wyników technologii diagnostycznych opisujących stan pacjenta, jak i wiedzy dotyczącej jednostek chorobowych. Daje to możliwość dokonania fuzji danych pochodzących z różnych źródeł (danych heterogenicznych) do postaci homogenicznej. Artykuł przedstawia metodę generowania modelu semantycznego wiedzy medycznej, wykorzystującą analizy leksykalne korpusów słownych.
Twórcy
autor
autor
autor
Bibliografia
  • [1] C. Burgess, „Representing and resolving semantic ambiguity: A contribution from high-dimensional memory modeling”, in: Gorfein, D.S. (Ed.), On the Consequences of Meaning Selection: Perspectives on Resolving Lexical Ambiguity, APA Press, 2001.
  • [2] H. Chen, K. J. Lynch „Automatic construction of networks of concepts characterizing document database”, IEEE Transactions on Systems, Man and Cybernetics, Vol. 22, No. 5, 885-902 (1992).
  • [3] Z. S. Harris, „Mathematical Structures of Language”, Interscience Publishers, New York, 1968.
  • [4] M. A. Hearst, „Automatic Acquisition of Hyponyms from Large Text Corpora”, Proceedings of the Fourteenth International Conference on Computational Linguistics, Nantes, 1992.
  • [5] K. Lund, C. Burgess, „Producing highdimensional semantic spaces from lexical co-occurence”, Behavior Research Methods, Instrumentation and Computers, 28, 203–208 (1996).
  • [6] M. Piasecki, M. Derwojedowa, P. Koczan, A. Przepiórkowski, S. Szpakowicz, M. Zawisławska, „Półautomatyczna konstrukcja Słowosieci” URL www.plwordnet.pl/main. Strona domowa projektu (2007).
  • [7] K. Polański (red.) Słownik syntaktyczno-generatywny czasowników polskich, t. 1-7, Kraków, 1980-1993.
  • [8] J. Rohmer, ”The Case for Using Semantic Nets as a Convergence Format for Symbolic Information Fusion in NATO”, RTO-MP-IST-040 Information Systems Technology Panel (IST) Symposium on Military Data and Information Fusion, Prague, Czech Republic, 2003.
  • [9] Słowosiec. Witryna WWW projektu. URL http://www.plwordnet.pwr.wroc.pl/main, (2007).
  • [10] P. Velardi, P. Fabriani, M. Missikoff, „Using text processing techniques to automatically enrich a domain ontology”, in: Proceedings of the international Conference on Formal Ontology in Information Systems, FOIS '01, ACM, 270-284, New York, 2001.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWA0-0052-0005
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.