Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  wordnet
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
plWordNet has been consequently built on the basis of the corpus-based wordnet development method. As plWordNet construction had started from scratch it was necessary to find a way to reduce the amount of work required, and not to reduce the quality. In the paper we discuss the gained experience in applying different tools based on Distributional Semantics methods to support the work of lexicographers. A special attention is given to the Paintball algorithm for semiautomated wordnet expansion and its application in the WordnetWeaver system.
PL
Niniejszy raport omawia zasady znakowania leksykalno-semantycznego banku drzew Składnica jednostkami leksykalnymi pochodzącymi ze Słowosieci. Ponadto prezentuje metodę przeniesienia znakowania nazw własnych z NKJP do Składnicy (wraz z ewaluacją). Wszystkie trzy wspomniane zasoby zostały pokrótce opisane. Na koniec przedstawiona została metoda aktualizacji uzyskanego znakowania do zmian zachodzących zarówno w Słowosieci, jak i w Składnicy.
EN
The present report discusses the principles of lexical-semantic annotation of treebank Składnica by means of Słowosieć (PlWordNet) lexical units. Moreover, it presents a method of mapping NKJP named entities annotation to Składnica (including evaluation). Ali three resources mentioned above are shortly described. Finally, a method of updating the annotation to changes appearing both in Słowosieć and Składnica.
PL
Niniejszy raport opisuje wstępne eksperymenty dotyczące klasyfikacji syntaktyczno-semantycznej czasowników polskich. Wpierw omówione zostały istniejące prace z tej dziedziny, dotyczące głównie języka angielskiego. Następnie opisana została gradacyjna analiza odpowiedniości i skupień, która została użyta do klasyfikacji. Potem przedstawiony został semantyczno-syntaktyczny słownik walencyjny będący źródłem danych do klasyfikacji. Na koniec zaprezentowane były właściwe eksperymenty dotyczące klasyfikacji wraz z ich ewaluacją.
EN
The present report describes initial experiments on syntactic-semantic classification of Polish verbs. First, the existing works on this subject were discussed, mainly concerning English. Second, Grade Correspondence-Cluster Analysis used in experiments was described. Next, syntactic-semantic valence dictionary of Polish verbs being a source of data for experiments was presented. Finally, actual experiments were discussed and evaluated.
4
Content available remote Przykładowe zastosowanie gradacyjnej analizy danych w badaniach lingwistycznych
PL
W niniejszym raporcie przebadano potencjał gradacyjnej analizy danych w odniesieniu do klasyfikacji czasowników względem stylów tekstów zgromadzonych w Korpusie IPI PAN. Ponieważ w Korpusie dominują dwa style: publicystyczny i protokół, analizę przeprowadzono dla dwóch zestawów danych: pełnego i z wyłączeniem wspomnianych stylów. Analogiczny proces analizy przeprowadzono dla danych zagregowanych po kategoriach semantycznych (sensach) czasowników pochodzących z wordnetu. Uzyskane wyniki zostały porównane.
EN
An example of grade data analysis application for linguistic research In the report, the potential of grade analysis is explored for the classification of verbs with regard to the IPI PAN Corpus text styles. Since two styles, publicystyczny (newspapers) and protokół (parliament protocols), dominate in the Corpus, the analysis is performed for two datasets: the entire Corpus and the subcorpus without the dominant styles. An analogous analysis is provided for the data aggregated by means of wordnet-like semantic categories (senses) of verbs. The obtained results are compared.
PL
Niniejszy raport opisuje proces doboru czasowników do eksperymentów przy tworzeniu słownika semantycznego czasowników polskich. Wpierw prezentowana jest charakterystyka semantyczna (oparta na literaturze anglojęzycznej) i syntaktyczna (oparta na literaturze polskiej) czasowników pod kątem ich zdolności do alternacji. Rozważany jest też zestaw czasowników używanych w automatycznym wykrywaniu alternacji i grupowaniu czasowników dla angielskiego. Z drugiej strony, przeanalizowane zostały ograniczenia stawiane przez Korpus IPI PAN. Sugerowany zestaw został ograniczony do czasowników rozpatrywanych w polskim wordnecie; zbadana została też ich nadreprezentacja w poszczególnych stylach tekstów Korpusu. Na tej podstawie wybrany został zestaw 99 czasowników do badań.
EN
The present report describes the process in which atest set of Polish verbs nas been selected for the creation of a semantic dictionary of Polish verbs, First, a semantic (based on English literature) and syntactic (based on Polish literature) characteristics of verbs alternation is presented. Next, a set of verbs used in automatic detection of alternations and verb classification (for English) is reviewed. On the other hand, the distribution of verbs in IPI PAN Corpus is analysed. A set of verbs has been limited to those considered in Polish wordnet, and overrepresentation of verbs in text styles of the Corpus has been exarnined. As a result, 99 verbs have been chosen for further work.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.