Tytuł artykułu
Autorzy
Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
The selection of test verbs for the creation of a semantic dictionary of Polish verbs
Języki publikacji
Abstrakty
Niniejszy raport opisuje proces doboru czasowników do eksperymentów przy tworzeniu słownika semantycznego czasowników polskich. Wpierw prezentowana jest charakterystyka semantyczna (oparta na literaturze anglojęzycznej) i syntaktyczna (oparta na literaturze polskiej) czasowników pod kątem ich zdolności do alternacji. Rozważany jest też zestaw czasowników używanych w automatycznym wykrywaniu alternacji i grupowaniu czasowników dla angielskiego. Z drugiej strony, przeanalizowane zostały ograniczenia stawiane przez Korpus IPI PAN. Sugerowany zestaw został ograniczony do czasowników rozpatrywanych w polskim wordnecie; zbadana została też ich nadreprezentacja w poszczególnych stylach tekstów Korpusu. Na tej podstawie wybrany został zestaw 99 czasowników do badań.
The present report describes the process in which atest set of Polish verbs nas been selected for the creation of a semantic dictionary of Polish verbs, First, a semantic (based on English literature) and syntactic (based on Polish literature) characteristics of verbs alternation is presented. Next, a set of verbs used in automatic detection of alternations and verb classification (for English) is reviewed. On the other hand, the distribution of verbs in IPI PAN Corpus is analysed. A set of verbs has been limited to those considered in Polish wordnet, and overrepresentation of verbs in text styles of the Corpus has been exarnined. As a result, 99 verbs have been chosen for further work.
Wydawca
Rocznik
Tom
Strony
1--126
Opis fizyczny
Bibliogr. 24 poz.
Twórcy
autor
- Instytut Podstaw Informatyki PAN ul. Ordona 21 01-237 Warszawa Polska, Elżbieta.Hajnicz@ipipan.waw.pl
Bibliografia
- Bański, p. (2001) The proposed encoding scheme for the IPI PAN corpus, prace IPI PAN nr 936, Warszawa
- de Busser, R., Angheluta, R. i Moens, M-F. (2002) Semantic case role detection for information extraction, Proceedings of the 19th International Conference on Computational Linguistics (COLING-2002), New Brunswick, Canada, s. 1198-1202
- de Busser, R. i Moens, M-F. (2004) Learning generic semantic roles, Generic Technologies for Information Extraction from Texts, Leuven, Belgium
- Dębowski, Ł. (2004) Trigram morphosyntactic tagger for Polish, w M. A. Kłopotek, S. T. Wierzchoń i K. Trojanowski (red.), Proceedings of the Conference on International Intelligent Information Processing and Web Mining (IIS:IIPWM'04), Springer, s. 409-413
- Derwojedowa, M., Piasecki, M., Szpakowicz, St. i Zawisławska, M. (2007) Polish WordNet on a Shoestring, Proceedings of GLDY CONFERENCE 2007: Biannual Conference of the Society for Computationał Linguistics and Language Technology, Universitat Tübingen, Günter Narr (w druku)
- Hajnicz, E. i Kupść, A. (2001) Przegląd analizatorów morfologicznych dla języka polskiego, Prace IPI PAN 937, Warszawa
- Lapata, M. (1999) Acquiring lexical generalizations from corpora: a case study for diathesis alternations, Proceedings o f the 37th Annual Meeting o f the Association for Compoutational Linguistics ACL'99, College Park, MA, s. 397-404
- Lapata, M. i Brew, C. (1999) Using subcategorization to resolve verb class ambiguity, Proceedings of the Joint SIGDAT Conference on Empirical methods in NLP and ery Large Corpora, College Park, MD, s. 266-274
- Lapata, M. i Brew, C. (2004) Verb class disambiguation using informative priors, Computationał Linguistics 30 (1), s. 45-73
- Levin, B. (1993) English verb classes and ałternation: a preliminary investigation, University of Chicago Press
- Levin, B. i Rappaport Hovav, M. (2005) Argument Realisation, Cambridge University Press
- McCarthy, D. (2000) Using semantic preferences to identify verbal participation in role switching alternations, Proceedings o f the Ist Meeting o f the North American Chapter of the Association for Computational Linguistics (NAACL 2000), Seattle WA, s. 256-263
- McCarthy, D. i Korhonen, A. (1998) Detecting verbal participation in diathesis alternations, Proceedings of the COLING-ACL'98 Conference, Montreal, Canada, s. 1493-1495
- Merlo, P. i Stevenson, S. (2001) Automatic verb classification based on statistical distributions of argument structure, Computationał Linguistics 27 (3), s. 373-408
- Obrębski, T. (2002) Automatyczna analiza składniowa języka polskiego z wykorzystaniem gramatyki zależnościowej, praca doktorska, IPI PAN, Warszawa
- Perlmutter, D.M. (1978) Impersonal passives and the unaccusative hypothesis, BLS 4, Berkelay Linguistics Society, Berkelay, CA, s. 157-189
- Perlmutter, D.M. i Postał, P.M. (1984) The l-advancement exlusiveness law, w D.M. Perlmutter i C. Rosen (red.) Studies in Reational Grammar 2, University of Chicago Press, Chicago, IL, s. 81-125
- Piasecki, M. (2006) Effective Architecture ofthe Polish Tagger, P. Sojka, I. Kopecek i K. Oliva (red.), Proceedings of Text, Speech and Dialog Conference, Brno, seria: Lecture Notes in Artificial Intelligence, Springer, Berlin
- Przepiórkowski, A. (2004) Korpus IPI PAN. Wersja wstępna, Instytut Podstaw Informatyki PAN, Warszawa
- Przepiórkowski, A., Bański, P., Dębowski, Ł., Hajnicz, E. i Woliński, M. (2003) Konstrukcja korpusu IPI PAN, Polonica XXII-XXII, s. 33-38
- Schulte im Walde, S. (2000) Clustering verb semantically according to their alternation behaviour, Proceedings o f the 18th International Conference on Computational Linguistics (COLING-2000), Saarbrücken, Germany, s. 747-753
- Schulte im Walde, S. i Brew, C. (2002) Inducing German semantic verb classes from purely syntactic subcategorization information, Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL'2002), Philadelphia, PA, s. 223—230.
- Szupryczyńska, M. (1973) Syntaktyczna klasyfikacja czasowników przybiernikowych, Państwowe Wydawnictwo Naukowe, Poznań.
- Woliński, M. (2004) Komputerowa weryfikacja gramatyki Świdzińskiego, praca doktorska, IPI PAN, Warszawa.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BUJ6-0018-0010