Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 64

Liczba wyników na stronie
first rewind previous Strona / 4 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  computational linguistics
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 4 next fast forward last
PL
Tematyka artykułu dotyczy zagadnień związanych z opracowywaniem narzędzi informatycznych przeznaczonych dla lingwistów zainteresowanych badaniem języków zagrożonych wymarciem. Autorzy przedstawili propozycję budowy narzędzi stanowiących generatory struktur syntaktycznych oraz systemów wspomagających przekład, które mogą posłużyć jako środek do usprawnienia rekonstrukcji i rewitalizacji zagrożonych wymarciem języków.
EN
The scope of the article concerns issues related to the development of computer tools intended for linguists interested in the study of languages threatened with extinction. The authors present a proposal for the construction of tools that are generators of syntactic structures and machine-aided human translation systems, which can serve as a means of improving the reconstruction and further revitalization of endangered languages.
PL
W artykule poruszono zagadnienia związane z budową generatorów struktur syntaktycznych. Tego rodzaju narzędzia informatyczne pozwalają na generowanie poprawnych składniowo zdań w wybranym języku. Oryginalną propozycję autorów stanowi zastosowanie generatorów struktur syntaktycznych na potrzeby wspomagania procesu rewitalizacji języków zagrożonych wymarciem.
EN
In the paper we present the issues related with syntactic structures generators. Such computer tools allow us to generate syntactically correct sentences in selected language. The original proposal of the authors is application of syntactic structures generators for the purpose of revitalization of endangered languages.
EN
The categorical compositional distributional model of natural language provides a conceptually motivated procedure to compute the meaning of a sentence, given its grammatical structure and the meanings of its words. This approach has outperformed other models in mainstream empirical language processing tasks, but lacks an effective model of lexical entailment. We address this shortcoming by exploiting the freedom in our abstract categorical framework to change our choice of semantic model. This allows us to describe hyponymy as a graded order on meanings, using models of partial information used in quantum computation. Quantum logic embeds in this graded order.
PL
Niniejszy artykuł jest już piątym z dłuższej serii artykułów poświeconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano koncepcję budowy wielojęzycznego generatora zdań typu SVO. Ponadto przedstawiono ideę wykorzystania języka pośredniczącego przekładu, którego rolę pełni w rozwijanym przez autorów systemie sztuczny język esperanto.
EN
The paper is the fifth of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the principles of construction of multilingual SVO sentences generator. Moreover, we present the concepts of using intermediate language in machine translation system for which we propose the artificial Esperanto language.
PL
Niniejszy artykuł jest czwartym z większej serii artykułów poświeconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano koncepcję budowy tzw. języków kontrolowanych, które stanowią ograniczony pod względem leksyki i składni podzbiór języków naturalnych, na których są wzorowane.
EN
The paper is the third of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the principles of so called controlled languages that constitute a subset of lexical units and syntactic structures of natural languages upon which they are based.
PL
Niniejszy artykuł jest pierwszym z większej serii artykułów poświęconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano zasady funkcjonowania generatora typu AN (Adjective – Noun), który obecnie opracowywany jest przez autorów dla języka szwedzkiego.
EN
The paper is the first of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the principles of functioning of an AN (Adjective - Noun) generator, which is currently being developed by the authors.
PL
Artykuł jest szóstym i zarazem ostatnim z dłuższej serii artykułów poświęconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano podstawowe idee związane z zasadami funkcjonowania systemów komputerowego przekładu wspomaganych przez człowieka. Autorzy proponują budowę systemu, za pośrednictwem którego użytkownik może tworzyć poprawne składniowo zdania w języku kontrolowanym, które następnie byłby w sposób automatyczny tłumaczone przez komputer na wybrany język docelowy.
EN
The paper is the sixth and the last of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the basic ideas and the way of functioning of Human-Aided Machine Translation (HAMT) systems. The authors propose to build the system by the means of which the user would be able to construct syntactically correct sentences in a controlled language. Then these sentences would be automatically translated by the computer into the target language.
PL
Niniejszy artykuł jest drugim z większej serii artykułów poświeconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano zasady funkcjonowania generatora typu SVO (Subject – Verb – Object), który obecnie opracowywany jest przez autorów dla języka niderlandzkiego.
EN
The paper is the second of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the principles of functioning of a SVO (Subjcet – Verb – Object) generator, which is currently being developed by the authors for the Dutch language.
PL
Niniejszy artykuł jest trzecim z większej serii artykułów poświęconej zagadnieniom opracowywania generatorów struktur gramatycznych dla wybranych języków naturalnych. W artykule opisano zasady funkcjonowania wielojęzycznego generatora typu VT (Verbum Transitivum), który umożliwia tłumaczenie przechodnich fraz czasownikowych występujących w odpowiednich formach gramatycznych na wybrane przez użytkownika języki naturalne.
EN
The paper is the third of a broader series of articles devoted to the issues of the development of syntactic structures generators for selected natural languages. The paper describes the principles of functioning of a VT (Verbum Transitivum) generator, which enables the process of translation of transitive verb phrases in proper grammatical forms into selected natural languages.
PL
Tematyka artykułu dotyczy opracowywanego przez autorów systemu komputerowego przekładu wspomaganego przez człowieka. Rozwijany system jest z założenia systemem wielojęzycznym, otwartym zarówno leksykalnie, jak i składniowo, który umożliwia komputerowy przekład pomiędzy parą dowolnie wybranych języków. W artykule skoncentrowano się na zagadnieniach związanych z przekładem zaimków osobowych, proponując w tym względzie oryginalne rozwiązanie.
EN
The topic of the paper is about human aided machine-translation system which is developed by the authors. This machine translation system is a multilingual system based on the concept of an intermediate language. The system is opened both lexically and syntactically and it can translate in both directions between any pair of languages. In the paper we concentrate on the issues related to translation of personal pronouns and we propose an original solution of this problem.
PL
Tematyka artykułu dotyczy opracowywanego przez autorów systemu automatycznego przekładu wspomaganego przez człowieka. Rozwijany system jest z założenia systemem wielojęzycznym, umożliwiającym komputerowy przekład pomiędzy parą dowolnie wybranych języków, co osiągnięto dzięki zastosowaniu koncepcji języka pośredniczącego przekładu. Z kolei odpowiednio wysoka jakość uzyskiwanych przekładów jest gwarantowana poprzez zastosowanie języków kontrolowanych, w których tworzone są przez użytkownika teksty podlegające procesom translatorskim.
EN
The topic of the paper is about human aided machine-translation system which is developed by the authors. This machine translation system is a multilingual system based on a concept of an intermediate language thanks to which it can translate in both directions between any pair of languages. The properly high quality of translation is achieved thanks to controlled languages in which the users of the system composed texts that are to be translated.
12
Content available remote Symulacja procesu pojawienia się struktur składniowych w protojęzyku
PL
Artykuł dotyczy wykorzystania komputerów na potrzeby przeprowadzania symulacji procesów ewolucyjnych zachodzących w językach naturalnych. W szczególności w artykule zamieszczono opis realizacji symulacji komputerowych procesu pojawiania się pierwszych struktur składniowych w ludzkich protojęzykach. W artykule pokazano, w jaki sposób w protojęzykach o holistycznej naturze słownictwa może dojść do wyodrębnienia podstawowych części zdania, takich jak podmiot, orzeczenie i dopełnienie.
EN
The paper concerns the issues of using computers for the simulation of evolutionary processes occurring in natural languages. In particular, the paper presents the results of computer simulations of emergence of first syntactic structures in human protolanguages. It shows how in the case of protolanguages with holophrastic nature of words the evolutionary processes can lead to emergence of subject, verb, and object.
PL
W artykule rozważono zagadnienia związane z automatyczną klasyfikacją języków naturalnych. Na przykładzie analizy systemów zaimków osobowych wybranych języków zaproponowano wykorzystanie systemu kodowania binarnego w celu uzyskania obiektywnej liczbowej miary stopnia wzajemnego podobieństwa języków. Zaproponowana metoda może stanowić podstawę do wypracowania nowego systemu klasyfikacji języków zastępującego tradycyjne klasyfikacje genetyczne, typologiczne i geograficzne.
EN
The paper discusses issues related to the automatic classification of natural languages. Taking an analysis of personal pronoun systems of selected languages as an example, we propose to use the system of binary coding to obtain an objective numerical measure of mutual similarity of languages. The proposed method can constitute the basis for the development of a new natural languages classification system, which could replace the traditional genetic, typological, and geographical classification systems.
PL
W artykule rozważono wykorzystanie technik symulacji komputerowej na potrzeby badania zjawisk związanych z ewolucją języków naturalnych. W stworzonym systemie symulacyjnym udało się odwzorować zjawiska związane ze spontanicznym powstawaniem nowych języków poprzez ewolucje języków już istniejących. Opracowany model uwzględnia także powszechnie występujące w świecie języków zjawisko systematycznego wymierania języków o niewielkiej liczbie użytkowników.
EN
The paper discusses how computer simulation techniques can be utilized for the purpose of examining the phenomena related to the natural evolution of languages. A simulation system was designed that enables the mapping of phenomena related to spontaneous creation of new languages by the evolution of languages existing so far. The model developed also takes into account a common phenomenon in the world of languages, i.e. extinction of small languages with a low number of their users.
PL
Tematyka artykułu dotyczy zagadnień związanych z komputerową symulacją procesów zachodzących podczas ewolucji języków naturalnych. Obszarem zainteresowań jest fenomen pojawienia się komunikacji językowej w społecznościach pierwotnie prelingwistycznych. Przeprowadzone przez autorów symulacje komputerowe pokazują, w jaki sposób może powstać prymitywny protojęzyk pozbawiony jakichkolwiek struktur składniowych, stanowiący zaczątek komunikacji językowej w danej społeczności.
EN
The topic of the paper is about the computer simulations of processes that take place during the natural language evolution. The area of interest is the phenomenon of emergence of language communication in primary pre-linguistic societies. The computer simulations which were conducted by the authors show in what manner the primitive protolanguage deprived of any syntactic structures could emerge to constitute the beginning of language communication in the given society.
PL
Niniejszy raport omawia zasady znakowania leksykalno-semantycznego banku drzew Składnica jednostkami leksykalnymi pochodzącymi ze Słowosieci. Ponadto prezentuje metodę przeniesienia znakowania nazw własnych z NKJP do Składnicy (wraz z ewaluacją). Wszystkie trzy wspomniane zasoby zostały pokrótce opisane. Na koniec przedstawiona została metoda aktualizacji uzyskanego znakowania do zmian zachodzących zarówno w Słowosieci, jak i w Składnicy.
EN
The present report discusses the principles of lexical-semantic annotation of treebank Składnica by means of Słowosieć (PlWordNet) lexical units. Moreover, it presents a method of mapping NKJP named entities annotation to Składnica (including evaluation). Ali three resources mentioned above are shortly described. Finally, a method of updating the annotation to changes appearing both in Słowosieć and Składnica.
EN
The paper discusses several key concepts related to the development of corpora and reconsiders them in light of recent developments in NLP. On the basis of an overview of present-day corpora, we conclude that the dominant practices of corpus design do not utilise the technologies adequately and, as a result, fail to meet the demands of corpus linguistics, computational lexicology and computational linguistics alike. We proceed to lay out a data-driven approach to corpus design, which integrates the best practices of traditional corpus linguistics with the potential of the latest technologies allowing fast collection, automatic metadata description and annotation of large amounts of data. Thus, the gist of the approach we propose is that corpus design should be centred on amassing large amounts of mono- and multilingual texts and on providing them with a detailed metadata description and high-quality multi-level annotation. We go on to illustrate this concept with a description of the compilation, structuring, documentation, and annotation of the Bulgarian National Corpus (BulNC). At present it consists of a Bulgarian part of 979.6 million words, constituting the corpus kernel, and 33 Bulgarian-X language corpora, totalling 972.3 million words, 1.95 billion words (1.95×109) altogether. The BulNC is supplied with a comprehensive metadata description, which allows us to organise the texts according to different principles. The Bulgarian part of the BulNC is automatically processed (tokenised and sentence split) and annotated at several levels: morphosyntactic tagging, lemmatisation, word-sense annotation, annotation of noun phrases and named entities. Some levels of annotation are also applied to the Bulgarian-English paralel corpus with the prospect of expanding multilingual annotation both in terms of linguistic levels and the number of languages for which it is available. We conclude with a brief evaluation of the quality of the corpus and an outline of its applications in NLP and linguistic research.
18
Content available remote Najbardziej znane korpusy tekstów : opracowanie przeglądowe
PL
Niniejszy raport opisuje najbardziej znane korpusy tekstów języka naturalnego. Wpierw analizowane są zasady konstruowania korpusu, czyli doboru składających się nań tekstów w zależności od przyjetego rozmiaru oraz określenia jego struktury. Następnie prezentowane są najbardziej znane korpusy, głównie anglojęzyczne, lecz także innych języków europejskich: francuskiego, niemieckiego, rosyjskiego i czeskiego. Szczególną uwagę poświęcono dwum korpusom polskim - Korpusowi IPI PAN oraz Narodowemu Korpusowi Języka Polskiego. Oddzielny rozdział poświęcony jest bankom drzew, czyli korpusom znakowanym syntaktycznie.
EN
The present report describes the most famous corpora of natural language texts. First, the rules of corpora construction are analysed, namely, determining its structure and selecting texts to be included in the corpus. Next, the most popular corpora are presented. The majority of them are English corpora, but corpora of other European languages: French, German, Czech and Russian are considered as well. The special attention is paid to two Polish corpora: the IPI PAN Corpus and the National Corpus of Polish. The separate section is devoted to treebanks, i.e., corpora that are syntactically annotated.
PL
Niniejszy raport opisuje wstępne eksperymenty dotyczące klasyfikacji syntaktyczno-semantycznej czasowników polskich. Wpierw omówione zostały istniejące prace z tej dziedziny, dotyczące głównie języka angielskiego. Następnie opisana została gradacyjna analiza odpowiedniości i skupień, która została użyta do klasyfikacji. Potem przedstawiony został semantyczno-syntaktyczny słownik walencyjny będący źródłem danych do klasyfikacji. Na koniec zaprezentowane były właściwe eksperymenty dotyczące klasyfikacji wraz z ich ewaluacją.
EN
The present report describes initial experiments on syntactic-semantic classification of Polish verbs. First, the existing works on this subject were discussed, mainly concerning English. Second, Grade Correspondence-Cluster Analysis used in experiments was described. Next, syntactic-semantic valence dictionary of Polish verbs being a source of data for experiments was presented. Finally, actual experiments were discussed and evaluated.
PL
Tematyka artykułu dotyczy zagadnień związanych z automatyzacją przekładu między językami naturalnymi. Jakość pracy współczesnych systemów komputerowego przekładu pozostawia wciąż bardzo wiele do życzenia. W artykule zamieszczono propozycję działań, które powinny przyczynić się do istotnego podniesienia jakości przekładu komputerowego i pozwolić na jego zbliżenie się do rezultatów pracy człowieka. W artykule zaproponowano przeniesienie procesu translacji z poziomu pojedynczych wyrazów na wyższy poziom wielowyrazowych fraz oraz przedstawiono postulat rozwoju systemów komputerowego przekładu zorientowanych na określone obszary tematyczne tłumaczonych tekstów. Wykazano celowość nałożenia swego rodzaju więzów na język źródłowy przekładu, co w znacznym stopniu powinno przyczynić się do eliminacji wieloznaczności tłumaczonych zdań.
EN
The paper discusses issues of machine translation between natural languages. The quality of contemporary machine translation systems is still relatively low and below users' expectations. In the paper we present some suggestions of activities that could result in raising the quality of machine translation and make it similar to the results of work of human translators. We propose the transfer of the translation process from the level of single words to a higher level of multiword phrases. Further, we postulate to develop machine translation systems that are oriented towards specific thematic areas of translated texts. We also demonstrate that some limitations must be placed upon the source language in order to eliminate the ambiguity of sentences to be translated.
first rewind previous Strona / 4 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.