Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The paper presents a method of automatic construction of a semantically annotated corpus using the results of a rulebased information extraction (IE) application. Construction of the corpus is based on using existing programs for text tokenization and morphological analysis and combining their results with domain related correction rules. We reuse the specialized IE system to obtain a corpus annotated on the semantic level. The texts included within the corpus are Polish free text clinical data. We present the documents - diabetic patients' discharge records, the structure of the corpus annotation and the methods for obtaining the annotations. Initial evaluations based on the results of manual verification of selected data subset are also presented. The corpus, once manually corrected, is designed to be used for developing supervised machine learning models for IE applications.
2
Content available Medical text data anonymization
EN
The paper discusses a program for removing patient identification information from hospital discharge documents in order to make them available for scientific research e.g. information extraction system designing. The presented method allows de–anonymization of documents using a key–code file that is created on the basis of a patient‘s surname, forename and date of birth. Problems of normalization of crucial data used in the key–code file creation are presented.
EN
The paper focuses on resolving natural language issues which have been affecting performance of our system processing Polish medical data. In particular, we address phenomena such as ellipsis, anaphora, comparisons, coordination and negation occurring in mammogram reports. We propose practical data-driven solutions which allow us to improve the systems performance.
4
Content available remote Składnikowe konstrukcje współrzędne w języku polskim : próba opisu w HPSG
PL
Niniejsza praca stanowi wstępny opis składnikowych konstrukcji współrzędnych wykorzystujący formalizm HPSG (Head-driven Phrase Structure Grammar, Pollard i Sag (1994)). Przyjęte tu rozwiązanie oparte jest na pracy Paritong (1992). Zakłada ono, że spójnik jest elementem głównym (ang. Head) frazy współrzędnej. Przyjęcie takiej analizy pozwala na zastosowanie ogólnych zasad gramatycznych HPSG także do konstrukcji współrzędnych. Opis obejmuje konstrukcje jednorodne, w wypadku koordynacji argumentów, jak również konstrukcje niejednorodne, w wypadku koordynacji modyfikatorów. Opisane zostały także uzgodnienia zachodzące w różnych rodzajach fraz współrzędnych. Analiza obejmuje wiele typów konstrukcji współrzędnych. Koordynacji mogą podlegać zarówno kompletne frazy jak też frazy z niezrealizowanymi wymaganiami. Opis obejmuje również koordynację wielu fraz połączonych różnymi spójnikami.
EN
This report is concerned with a preliminary description of constituent coordination in Polish couched within the framework of HPSG (Head-driven Phrase Structure Grammar). The analysis presented in this paper is based on an HPSG approach to constituent coordination developed in Paritong (1992). Following Paritong (1992) we treat the conjuctional head of a coordinated phrase. Such an approach allows us to apply general HPSG principles also to coordination. We account for coordination of homogeneous argument constituents but also for coordination of non-homogeneous modifiers. The same general mechanism is used to account for coordination of saturated and partial constituents as well as for multiple coordination. Finally, we provide a preliminary analysis of agreement patterns in various kinds of coordinated phrases.
PL
Niniejszy raport zawiera klasyfikacje zjawisk syntaktycznych charakterystycznych dla zdań w języku polskim. Celem tworzenia niniejszej klasyfikacji było opracowanie listy konstrukcji gramatycznych, które powinny być analizowane przez formalne gramatyki języka polskiego. W oparciu o opracowane klasyfikacje utworzono zbiór zdań testowych ilustrujących wszystkie objęte nią zjawiska. Zbiór ten zawiera zarówno zdania poprawne, jak i niepoprawne. Dzieki temu służyć może nie tylko do sprawdzania, jak szeroki podzbiór języka jest przez daną gramatykę opisywany, ale także na ile dana gramatyka jest wiarygodna (odrzuca błędne konstrukcje). Lista zdań może służyć jako zbiór testowy dla prac nad opisem formalnym języka polskiego i nad implementacją takich opisów.
EN
This report contains a classification of linguistic phenomena of Polish. The general aim of the reserch was to prepare a list of syntactic constructions which have to be analyzed by any complete formal or computational grammar of Polish. On the basis of the elaborated classification a test set of Polish sentences has been developed (test-suite). The test-suite illustrates all phenomena distinguished in the classification. It contains both correct and incorrect sentences, so not only coverage, but also adequacy (specificity) of a given grammar can be checked. The test-suite can be used in any formal work on the description of Polish.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.