Automatyczna budowa semantycznego modelu objawów chorobowych na bazie korpusu słownego

Szostek, G.; Jaszuk, M.; Walczak, A.

Artykuł - szczegóły

Tytuł artykułu

Automatyczna budowa semantycznego modelu objawów chorobowych na bazie korpusu słownego

Autorzy

Szostek G. , Jaszuk M. , Walczak A.

Treść / Zawartość

Pełne teksty:

httpwww_bg_utp_edu_plartbiuletyn20isi93543szostekjaszukwalczak.pdf

Pobierz

Identyfikatory

Warianty tytułu

Automatic construction of a semantic model of disease symptoms based on text corpus

Języki publikacji

Abstrakty

The research described in article refers the medical data. Descriptions of diagnostic technologies results and descriptions of diseases form the text corpus. The corpus is the basis for building a semantic model of symptoms. A specific symptom can be written in the natural language in many ways, which is a problem for further processing of such information. There is a need to record symptoms in a uniform format. Such format allows for application of the same methods and mathematical tools to support the process of diagnosis. The paper presents method of generating a semantic model based on text corpus. Construction of the model is a part of the research, which aims to make the fusion of data from different sources (heterogeneous data) into homogeneous form.

Opisane w artykule badania dotyczą danych z dziedziny medycyny. Wyniki badań diagnostycznych rejestrowane są na różne sposoby. Mogą mieć postać tabel, wykresów, obrazów. Niezależnie od oryginalnego formatu danych możliwe jest sporządzenie ich opisu słownego, który koncentruje się na opisie zaobserwowanych objawów chorobowych. Opisy takie tworzą korpusy słowne dotyczące poszczególnych technologii diagnostycznych. W podobny sposób zapisywana jest wiedza dotycząca jednostek chorobowych. Ma ona postać korpusów tekstowych, w których zawarte są opisy objawów specyficznych dla poszczególnych schorzeń. Za pomocą narzędzi przetwarzania języka naturalnego możliwe jest automatyczne wydobycie z tekstów modeli semantycznych, opisujących poszczególne technologie diagnostyczne oraz choroby. Pewne utrudnienie stanowi fakt, że wiedza medyczna może zostać zapisana w języku naturalnym na wiele sposobów. Zastosowanie formatu semantycznego pozwala wyeliminować te niejednoznaczności zapisu. W konsekwencji dostajemy ujednolicony model wiedzy medycznej, zarówno od strony wyników technologii diagnostycznych opisujących stan pacjenta, jak i wiedzy dotyczącej jednostek chorobowych. Daje to możliwość dokonania fuzji danych pochodzących z różnych źródeł (danych heterogenicznych) do postaci homogenicznej. Artykuł przedstawia metodę generowania modelu semantycznego wiedzy medycznej, wykorzystującą analizy leksykalne korpusów słownych.

Słowa kluczowe

semantic network ontology natural language processing

sieć semantyczna ontologia przetwarzanie języka naturalnego

Wydawca

Institute of Computer and Information Systems, Faculty of Cybernetics, Military University of Technology

Czasopismo

Biuletyn Instytutu Systemów Informatycznych

Rocznik

2012

Tom

nr 9

Strony

35--43

Opis fizyczny

Bibliogr. 10 poz., wykr.

Twórcy

autor

Szostek G.

autor

Jaszuk M.

autor

Walczak A.

Wydział Cybernetyki Wojskowej Akademii Technicznej w Warszawie, grazyna.szostek@gmail.com

Bibliografia

[1] C. Burgess, „Representing and resolving semantic ambiguity: A contribution from high-dimensional memory modeling”, in: Gorfein, D.S. (Ed.), On the Consequences of Meaning Selection: Perspectives on Resolving Lexical Ambiguity, APA Press, 2001.
[2] H. Chen, K. J. Lynch „Automatic construction of networks of concepts characterizing document database”, IEEE Transactions on Systems, Man and Cybernetics, Vol. 22, No. 5, 885-902 (1992).
[3] Z. S. Harris, „Mathematical Structures of Language”, Interscience Publishers, New York, 1968.
[4] M. A. Hearst, „Automatic Acquisition of Hyponyms from Large Text Corpora”, Proceedings of the Fourteenth International Conference on Computational Linguistics, Nantes, 1992.
[5] K. Lund, C. Burgess, „Producing highdimensional semantic spaces from lexical co-occurence”, Behavior Research Methods, Instrumentation and Computers, 28, 203–208 (1996).
[6] M. Piasecki, M. Derwojedowa, P. Koczan, A. Przepiórkowski, S. Szpakowicz, M. Zawisławska, „Półautomatyczna konstrukcja Słowosieci” URL www.plwordnet.pl/main. Strona domowa projektu (2007).
[7] K. Polański (red.) Słownik syntaktyczno-generatywny czasowników polskich, t. 1-7, Kraków, 1980-1993.
[8] J. Rohmer, ”The Case for Using Semantic Nets as a Convergence Format for Symbolic Information Fusion in NATO”, RTO-MP-IST-040 Information Systems Technology Panel (IST) Symposium on Military Data and Information Fusion, Prague, Czech Republic, 2003.
[9] Słowosiec. Witryna WWW projektu. URL http://www.plwordnet.pwr.wroc.pl/main, (2007).
[10] P. Velardi, P. Fabriani, M. Missikoff, „Using text processing techniques to automatically enrich a domain ontology”, in: Proceedings of the international Conference on Formal Ontology in Information Systems, FOIS '01, ACM, 270-284, New York, 2001.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BWA0-0052-0005