Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!

Znaleziono wyników: 2

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  korpus tekstowy
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
1
Content available remote The proposed encoding scheme for the IPI PAN corpus
EN
The present report describes the encoding scheme used for the purpose of creating a large annotated corpus of Polish, referred to here as the IPI PAN corpus. The corpus is going to contain at least 75-100 million words, and is going to be annotated structurally and morphosyntactically according to the suggestions laid out in the Corpus Encoding Standard (CES) Guidelines. The report begins with an overview of the existing approaches to corpus encoding, discusses the reasons behind the adoption of the CES, and finishes with a description of the activities to be performed during the process of constructing the IPI PAN corpus.
PL
Praca opisuje standard strukturalnego i morfosyntaktycznego oznaczania tekstu znany jako CES, czyli Corpus Encoding Standard, skupiając się na jego nowoczesnej implementacji w języku XML. Standard ten będzie użyty do oznaczenia dużego korpusu tekstów języka polskiego przygotowanego w Instytucie Podstaw Informatyki PAN w Warszawie, pod kątem zastosowań w inżynierii języka Autor omawia przyczyny wyboru tego właśnie standardu, a w szczególności jego wersji zdefiniowanej w języku XML. Praca kończy się opisem praktycznych czynności, jakie będą wykonane w ramach konstruowania korpusu.
2
Content available remote Projekt anotacji morfosyntaktycznej korpusu języka polskiego
PL
Niniejszy raport zawiera propozycję zestawu znaczników morfosyntaktycznych do anotacji korpusu tekstów języka polskiego. Zestaw ten opiera się wyłącznie na kryteriach morfologicznych i składniowych, w tych terminach zdefiniowane zostało też pojęcie klasy gramatycznej, zwykle utożsamiane z semantycznym pojęciem leksemu. Raport zawiera także ogólne wskazówki praktyczne dotyczące anotowania korpusu z wykorzystaniem zaproponowanego tu zestawu znaczników, a także porównanie tego zestawu znaczników z innymi systemami znakowania morfosyntaktycznego zaproponowanymi dla języka polskiego i innych języków słowiańskich.
EN
This report presents a morphosyntactic tagset for Polish based solely on morphological and syntactic criteria. In particular, the notion of part-of-speech, often equated with the essentially semantic notion of lexeme, is defined in purely morphosyntactic terms. The report also contains general guidelines for text annotation using the proposed tagset; as well as a comparison with other tagsets proposed for Polish and other Slavic languages.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.