Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 14

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
Niniejszy raport omawia zasady znakowania leksykalno-semantycznego banku drzew Składnica jednostkami leksykalnymi pochodzącymi ze Słowosieci. Ponadto prezentuje metodę przeniesienia znakowania nazw własnych z NKJP do Składnicy (wraz z ewaluacją). Wszystkie trzy wspomniane zasoby zostały pokrótce opisane. Na koniec przedstawiona została metoda aktualizacji uzyskanego znakowania do zmian zachodzących zarówno w Słowosieci, jak i w Składnicy.
EN
The present report discusses the principles of lexical-semantic annotation of treebank Składnica by means of Słowosieć (PlWordNet) lexical units. Moreover, it presents a method of mapping NKJP named entities annotation to Składnica (including evaluation). Ali three resources mentioned above are shortly described. Finally, a method of updating the annotation to changes appearing both in Słowosieć and Składnica.
2
Content available remote Najbardziej znane korpusy tekstów : opracowanie przeglądowe
PL
Niniejszy raport opisuje najbardziej znane korpusy tekstów języka naturalnego. Wpierw analizowane są zasady konstruowania korpusu, czyli doboru składających się nań tekstów w zależności od przyjetego rozmiaru oraz określenia jego struktury. Następnie prezentowane są najbardziej znane korpusy, głównie anglojęzyczne, lecz także innych języków europejskich: francuskiego, niemieckiego, rosyjskiego i czeskiego. Szczególną uwagę poświęcono dwum korpusom polskim - Korpusowi IPI PAN oraz Narodowemu Korpusowi Języka Polskiego. Oddzielny rozdział poświęcony jest bankom drzew, czyli korpusom znakowanym syntaktycznie.
EN
The present report describes the most famous corpora of natural language texts. First, the rules of corpora construction are analysed, namely, determining its structure and selecting texts to be included in the corpus. Next, the most popular corpora are presented. The majority of them are English corpora, but corpora of other European languages: French, German, Czech and Russian are considered as well. The special attention is paid to two Polish corpora: the IPI PAN Corpus and the National Corpus of Polish. The separate section is devoted to treebanks, i.e., corpora that are syntactically annotated.
PL
Niniejszy raport opisuje wstępne eksperymenty dotyczące klasyfikacji syntaktyczno-semantycznej czasowników polskich. Wpierw omówione zostały istniejące prace z tej dziedziny, dotyczące głównie języka angielskiego. Następnie opisana została gradacyjna analiza odpowiedniości i skupień, która została użyta do klasyfikacji. Potem przedstawiony został semantyczno-syntaktyczny słownik walencyjny będący źródłem danych do klasyfikacji. Na koniec zaprezentowane były właściwe eksperymenty dotyczące klasyfikacji wraz z ich ewaluacją.
EN
The present report describes initial experiments on syntactic-semantic classification of Polish verbs. First, the existing works on this subject were discussed, mainly concerning English. Second, Grade Correspondence-Cluster Analysis used in experiments was described. Next, syntactic-semantic valence dictionary of Polish verbs being a source of data for experiments was presented. Finally, actual experiments were discussed and evaluated.
4
Content available remote Przykładowe zastosowanie gradacyjnej analizy danych w badaniach lingwistycznych
PL
W niniejszym raporcie przebadano potencjał gradacyjnej analizy danych w odniesieniu do klasyfikacji czasowników względem stylów tekstów zgromadzonych w Korpusie IPI PAN. Ponieważ w Korpusie dominują dwa style: publicystyczny i protokół, analizę przeprowadzono dla dwóch zestawów danych: pełnego i z wyłączeniem wspomnianych stylów. Analogiczny proces analizy przeprowadzono dla danych zagregowanych po kategoriach semantycznych (sensach) czasowników pochodzących z wordnetu. Uzyskane wyniki zostały porównane.
EN
An example of grade data analysis application for linguistic research In the report, the potential of grade analysis is explored for the classification of verbs with regard to the IPI PAN Corpus text styles. Since two styles, publicystyczny (newspapers) and protokół (parliament protocols), dominate in the Corpus, the analysis is performed for two datasets: the entire Corpus and the subcorpus without the dominant styles. An analogous analysis is provided for the data aggregated by means of wordnet-like semantic categories (senses) of verbs. The obtained results are compared.
PL
Niniejszy raport opisuje proces doboru czasowników do eksperymentów przy tworzeniu słownika semantycznego czasowników polskich. Wpierw prezentowana jest charakterystyka semantyczna (oparta na literaturze anglojęzycznej) i syntaktyczna (oparta na literaturze polskiej) czasowników pod kątem ich zdolności do alternacji. Rozważany jest też zestaw czasowników używanych w automatycznym wykrywaniu alternacji i grupowaniu czasowników dla angielskiego. Z drugiej strony, przeanalizowane zostały ograniczenia stawiane przez Korpus IPI PAN. Sugerowany zestaw został ograniczony do czasowników rozpatrywanych w polskim wordnecie; zbadana została też ich nadreprezentacja w poszczególnych stylach tekstów Korpusu. Na tej podstawie wybrany został zestaw 99 czasowników do badań.
EN
The present report describes the process in which atest set of Polish verbs nas been selected for the creation of a semantic dictionary of Polish verbs, First, a semantic (based on English literature) and syntactic (based on Polish literature) characteristics of verbs alternation is presented. Next, a set of verbs used in automatic detection of alternations and verb classification (for English) is reviewed. On the other hand, the distribution of verbs in IPI PAN Corpus is analysed. A set of verbs has been limited to those considered in Polish wordnet, and overrepresentation of verbs in text styles of the Corpus has been exarnined. As a result, 99 verbs have been chosen for further work.
PL
Niniejszy raport zawiera adaptację gramatyki Montague dla języka polskiego. Podstawowe założenia i koncepcje Montague zostały zachowane. Zasadnicza zmiana polega na zastąpieniu transformacyjnej metody obsługi fleksji metodą uzgodnień. Uwzględnione zostały wszystkie podstawowe kategorie gramatyczne: rzeczowniki, czasowniki, przymiotniki i przysłówki (zdaniowe i przyczasownikowe).
EN
The present report contains an adaptation of Montague grammar for Polish. The basic Montague's assumptions and concepts are preserved. The main change consists in replacing an transformational method of treating an inflexion by the coordination method. All basic grammar categories: nouns, verbs, adjectives and adverbs are considered.
PL
Niniejszy raport opisuje własności formalne gramatyki Montague, jakie ujawniły się podczas tworzenia polskiej wersji formalizmu. Najpierw prezentowane są techniki przedefiniowywania typu obiektów oraz tzw. postulaty znaczeniowe, które umożliwiają przekształcanie wyrażeń formalizmu na postać reprezentującą znaczenie wypowiedzeń języka naturalnego w sposób bardziej intuicyjny. Na koniec omawiane są zjawiska, dla których ten potężny mechanizm został poniekąd stworzony: byty hipotytyczne i przykładowy czasownik wiedzy wiedzieć.
EN
The present report describes formal properties of Montague grammar which have appeared during elaboration of the polish version of the formalism. First, techniques of redefining of object types and so called meaning postulates are presented. They enable us to transform expressions of the logic onto the form representing meaning of the natural language expressions in more intuistic way. Some limitations of the formalism are discussed. Last but not least, there are handled phenomena, for which this powerful intenssional phormalism was elaborated: hypothetical beings and knowledge verbs represented by the verb believe
PL
Niniejszy raport stanowi omówienie Teorii Reprezentacji Dyskursu (w skrócie DRT) w postaci przedstawionej przez Kampa i Reylego (1993). Prezentowana jest zarówno podstawowa wersja teorii, jak i dwa jej rozszerzenia: jedno dotyczące reprezentacji liczby mnogiej (znaczniki zbiorowe) i rozszerzonych kwantyfikatorów (DRT_Pl), drugie kwestii związanych z czasem i aspektem (DRT_T). Przedstawiona jest także translacja wersji podstawowej na rachunek predykatów I rzędu. Raport skupia się na analizie własności DRT względem oryginalnej semantyki Kampa i Reylego opartej na pojęciu osadzeń wraz z pokazaniem, które z tych własności przenoszą się na zmodyfikowane wersje teorii DRT_Pl i DRT_T. Wykazujemy także, że wiele tautologii rachunku zdań zachowuje swą ważność po przeformułowaniu ich na język DRT. Na koniec dokonano krótkiego porównania omawianej semantyki z późniejszą semantyką (statyczną) opisaną przez van Eijcka i Kampa (1997).
EN
The present report contains a discussion of Discourse Representation Theory (DRT) as formulated in Kamp and Reyle (1993). Apart form the basie version of the theory, the report deser ibes its two extensions: the first concerning representation of plurals and generalized quan-tifiers (DRTpi), the second concerning tense and aspect (DRTy). A translation of the basie version into the first order predicate calculus is described, too. The main focus of the report is an analysis of the properties of DRT with regard to the original Kamp and Reyle's semantics based on the notion of embeddings. Next, the report shows which of these properties carry over to the two modified versions of the theory, i.e.,DRTp; and DRTx- We show also that many of the tautologies of the propositional calculus arę valid after their transposition to the DRT language. Finally, a short comparison of the DRT semantics considered here with the later (static) semantics discussed by van Eijck and Kamp (1997).
9
Content available remote Przegląd formalnych metod semantycznych
PL
Niniejsze opracowanie zawiera przegląd trzech formalizmów, służących do reprezentacji semantyki j. naturalnych, opartych na teorii modeli. Są to: Semantyka Montague, Teoria Reprezentacji Dyskursu (ang. Discourse Reprezention Theory (DRT)) oraz Semantyka oparta na zasobach leksykalnych (ang. Lexical Resource Semantics (LRS)). Dla każdego z tych rozwiązań przedstawiamy formalizm logiczny będący jego podstawą, przykładową gramatykę dla (ograniczonego) fragmentu j. angielskiego oraz zbiór zasad translacji rozbiorów gramatycznych uzyskanych w wybranej gramatyce na właściwy formalizm. Na koniec prezentowane jest porównanie prezentowanych podejść.
EN
This report contains a survey of three formalisms serving to represent natural language semantics and based on model theory. We choose Montague Semantics, Discourse Representation Theory (DRT) and Lexical Resource Semantics (LRS). For every solution, we present logical formalism it is based on, an exemplary grammar for a (limited) fragment of English and a set of rules of translation of syntactic analysis obtained in a chosen grammar onto the appropriate formalism. Finally, we present a comparison of the solutions under presentation.
10
Content available remote Przegląd analizatorów morfologicznych dla języka polskiego
PL
Niniejsze opracowanie zawiera przegląd sześciu analizatorów morfologicznych języka polskiego: Gram, PoMor, SAM, LEM, XeLDA, AMOR. Raport rozpoczyna się od prezentacji tekstów opracowanych w celu porównania omawianych analizatorów oraz współczynników służących do oceny statystycznej skuteczności ich działania. W następnych rozdziałach po kolei omawiane są poszczególne analizatory wraz z efektami ich działania na przygotowanych tekstach. Porównanie wyników działania analizatorów przedstawione zostało w podsumowaniu.
EN
This report contains a survey of six morphological analysers for the Polish language: Gram, PoMor, SAM, LEM, XeLDA, AMOR. The report begins with a presentation of tests we adopted for a comparison of the analysers. We also introduce definitions of factors which serve for statistical evaluation of the tests. Subsequent sections present particular analysers and discuss test results. The summary provides a comparison of the tested analysers.
11
Content available remote Representing solid intervals by means of point skeletons
EN
This report is a continuation of the previous report "Defining intervals by means of point skeletons: generalization of pairs of points", where a notion of "point skeletons" is introduced. Point skeletons are organized by a precedence relation < and the inclusion relation C. In this report, the notion of solidity of intervals is introduced for point skeletons. Three axiomatizations are presented adequate for solid point skeletons. They correspond to axiomatizations of the previous report. At the end of the report, a comparison between representations of intervals by means of point skeletons and sets of points is performed.
PL
Niniejszy raport stanowi kontynuację poprzedniego raportu zatytułowanego "Definiowanie przedziałów za pomocą szkieletów punktowych: uogólnienie par punktów", w którym wprowadzone zostało pojęcie "szkieletów punktowych". Szkielety punktowe są porządkowane przez relację poprzedzania < oraz relację zawierania C. W niniejszym raporcie pojęcie solidności przedziałów zostało sformułowane dla szkieletów punktowych. Zaprezentowano aksjomatyzacje dla trzech różnych relacji poprzedzania właściwe dla solidnych szkieletów punktowych, stanowiące odpowiedniki aksjomatyzacji z poprzedniego raportu. Raport kończy porównanie pomiędzy reprezentacją przedziałów za pomocą szkieletów punktowych z reprezentacją za pomocą wypukłych zbiorów punktów.
12
Content available remote Defining intervals by means of point skeletons : generalization of pairs of points
EN
This report is a continuation of our earlier work on time intervals defined in the non-linear point time framework. It turns out that pairs of points, which are a very convenient way of representing intervals, in non-linear time form a class of intervals too small to be sonsidered as a satisfactory representation. In this report, a notion of point skeletons is introduced, being a generalization of a notion of pairs of points adequate for non-linear time enabling us to represent a substantially lager classes of intervals than pairs of points. Point skeletons are organized by a precedence relation < and the overlapping relation C. Three axiomatizations are presented, for three different precedence relations which could be naturally defined for point skeletons (being counterparts of precedence relation defined for intervals represented as sets of points). Each axiomatization is proven to be complete.
PL
Niniejszy raport stanowi kontynuację wcześniejszych prac dotyczących definiowania przedziałów w nieliniowym czasie punktowym. Okazuje się, że pary punktów, będące wyjątkowo wygodnym sposobem reprezentacji przedziałów, w przypadku czasu nieliniowego formują klasę przedziałów zbyt wąską, by można uznać ją za satysfakcjonującą reprezentację. W omawianym raporcie wprowadzane jest pojęcie szkieletów punktowych, będące odpowiednim dla czasu nieliniowego uogólnieniem pojęcia par punktów, i umożliwiające reprezentowania znacznie większej klasy przedziałów niż pary punktów. Szkielety punktowe są porządkowane przez relację poprzedzania < oraz relację zawierania C. Zaprezentowane są trzy aksjomatyzacje dla trzech różnych relacji poprzedzania, jakie mogą być w naturalny sposób zdefiniowane dla szkieletów punktowych, i będących odpowiednikami relacji poprzedzania zdefiniowanych dla przedziałów czasu reprezentowanych jako zbiory punktów. Przedstawiono dowód pełności każdej z tych aksjomatyzacji.
PL
W nieniejszej pracy zaproponowane zostało rozszerzenie zbioru wzajemnych położeń (relacji prymitywnych) pomiędzy przedziałami stanowiącymi pary punktów na przypadek czasu nieliniowego. Rozważany jest zarówno czas uporządkowany częściowo, jak i lewostronnie liniowo. Nastepnie analizowana jest reprezentowalność nieprymitywnych (złożonych) relacji między takimi przedziałami za pomocą (punktowych) relacji między ich końcami. Na koniec wyróżniona jest podklasa przedziałów solidnych wrza z odpowiednim zbiorem relacji prymitywnych. Tym razem tablice składania takich relacji zostały również zaproponowane.
14
Content available remote Intervals in non-linear point time : the longer paper
EN
This report contains a characterization of time intervals defined in point time framework. We start from presenting brief description of non-linear point time structures. Next basic properties of sets of points and pairs of points are suggested, and their comparison is conducted. Complete axiomatizations are presented for all the theories depending on definition of intervals and relations ordering them.
PL
Niniejsza praca zawiera charakterystykę reprezentacji przedziałów czasu jako zbiorów i jako par punktów czasu. Na początku przedstawiony został zwięzły opis nieliniowych struktur czasu. Następnie opisane zostały podstawowe własności zbiorów punktów i par punktów wraz z ich porównaniem. Dla wszystkich teorii przedstawione są pełne aksjomatyzacje, uzależnione od definicji przedziałów i porządkujących je relacji.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.