Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

System translacji automatycznej oparty na uogólnionych przykładach translacyjnych

Wybrane pełne teksty z tego czasopisma
Warianty tytułu
The example based machine translation system
Języki publikacji
Translacja automatyczna o wysokiej jakości pomiędzy językami naturalnymi jest od wielu lat niedościgłym marzeniem dla wielu badaczy związanych z tą niezwykle pasjonującą, interdyscyplinarną dziedziną zastosowań informatyki. Translacja automatyczna była jedną z pierwszych aplikacji jakie zostały zaproponowane dla komputerów, a pierwsze próby czynione w tym względzie pochodzą aż z lat pięćdziesiątych dwudziestego wieku. Niestety pomimo pierwszych sukcesów odniesionych w tej dziedzinie szybko okazało się, że zautomatyzowanie translacji jest zadaniem o wiele trudniejszym, ale zarazem i o wiele ciekawszym z naukowego punktu widzenia, niż pierwotnie sądzono. Powstała całkiem niedawno technika translacji automatycznej oparta na tzw. przykładach translacyjnych wydaje się być poważną alternatywą dla istniejących już metod automatyzacji translacji pomiędzy językami naturalnymi. W artykule zaproponowano wykorzystanie techniki translacji automatycznej opartej na przykładach w systemie, który byłby zdolny tłumaczyć dowolne teksty należące do języka ogólnego. Autor zaproponował własną, oryginalną modyfikację techniki translacji automatycznej opartej na przykładach, która umożliwia uwzględnienie osobliwości gramatycznych języka polskiego. Rezultaty wstępne, uzyskane podczas przeprowadzonych eksperymentów wyglądają niezwykle obiecująco, a zaproponowana metoda wydaje się być krokiem podstawowym we właściwym kierunku, na drodze do budowy w pełni automatycznego systemu translacji, który byłby zdolny do dokonywania przekładów o wysokiej jakości, przy czym przekłady te dokonywane byłyby dla dowolnych tekstów, a nie tylko dla tekstów ograniczonych do pewnej wybranej dziedziny działalności ludzkiej.
High-quality machine translation between human languages has for a long time been an unattainable dream for many computer scientists involved in this fascinating and interdisciplinary field of the application of computers. Machine translation is a science about writing computer programs that are able to translate in a fully automatic way between natural languages, e.g. between Spanish and Korean. Machine translation was invented by an American Warren Weaver, who on the 15th of July 1949 sent his famous memorandum to Rockefeller Foundation with which he started the scientific research in the field. The first research group was constituted on the MIT in 1952. The first public demo of an operating machine translation system took place in New York on the 7th January 1954. During this demo the machine translation system translated 49 simple sentences from Russian into English. But, after over 50 year of intensive scientific research machine translation is still far away from its satisfactory solution! There are many reasons why machine translation is so extremely difficult. One of them is the ambiguity of natural language. The ambiguity can manifest on the world level (words can have many different equivalents in the target language), syntactic level (the syntactic analysis of a given sentence can be performed in many different ways) and semantic level (the whole sentence can be understood in many different ways). The other reason of fundamental difficulties with translation processes are the differences between the grammar systems of source and target languages. Also very important are differences in the vocabularies of source and target languages, where it is often difficult to find the exact equivalents of source words. Last but not least, is that many elements of the source text must be translated in an idiomatic way. The developed quite recently example - based machine translation technique seems to be a serious alternative to the existing automatic translation techniques. In the paper the usage of the example based machine translation technique for the development of a system, which would be able to translate an unrestricted text is proposed. The new approach to the example - based machine translation technique that takes into account the peculiarity of the Polish grammar is developed. The Polish language, which belongs to the group of Slavonic languages has a quite complex grammar. The main feature of Polish is its flexion nature, which makes learning it extremely difficult for foreigner. In the Polish grammar there can be found such phenomena as declination of nouns (there are 6 cases) and conjugation of verbs. Also there are singular and plural forms of words and 3 gendes (masculine, feminine and neutral). These phenomena make the direct usage of the Example - Base Machine Translation for Polish language difficult and non - effective. In order to implement this technique for the Polish language it must be modifield thoroughly. This author proposed such modification, which takes into account the peculiarities of the Polish grammar and that allows for it affective implementation for the purpose of translating into Polish from the most of West European languages. The obtained primary results of the development of proposed system seem to be very promising and appear to be a step made in the right direction towards a fully - automatic high quality machine translation system for unrestricted text.
Opis fizyczny
Bibliogr. 8 poz.
  • Katedra Automatyki AGH, al. Mickiewicza 30, 30-059 Kraków
  • 1. M. Gajer: System translacji automatycznej oparty na dialogu z użytkownikiem i przykładach translacyjnych. Pro Dialog 14(2002), Poznań, Wydawnictwo NAKOM, ss. 77-115
  • 2. M. Gajer: Fakty i mity na temat systemów translacji automatycznej. Elektronizacja m 1-2/2002, Warszawa, Wydawnictwo SIGMA-NOT, ss. 33-36
  • 3. D. Arnold, L. Balkan, S. Meijer, R. L. Humphreys, L. Sadler: Machine Translation: An Introductory Guide. London, NCC Blackwell, 1994
  • 4. P. Whitelock, K. Kilby: Linguistic and Computational Techniques in Machine Translation System Design. London, UCL Press, 1995
  • 5. E. Nyberg, T. Mitamura, J. Carbonell: The KANT Machine Translation System: From R&D to Initial Deployment. Pittsburgh, USA, Center for Machine Translation, Carnegie Mellon University, 1996
  • 6. H. Ney, S. Nieen, F. J. Och, H. Sawaf, C. Tillmann, S. Vogel: Algorithms for Statistical Translation of Spoken language. IEEE Transactions on Speech and Audio Processing, vol. 8, no. 1, January 2000, pp. 24-36
  • 7. J. G. Carbonell, T. Mitamura, E. H. Nyberg: The KANT Perspective: A Critique of Pure Transfer (and Pure Interlingua, Pure Statistics,...), Pittsburgh, USA, Center for Machine Translation, Carnegie Mellon University, 1998
  • 8. C. Rico: From Novelty to Ubiquity: Computers and Translation at the Close of Industrial Age.
Typ dokumentu
Identyfikator YADDA
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.