PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Wprowadzenie do problematyki systemów komputerowego przekładu opartych na metodzie Statistical-Based Machine Translation

Autorzy
Identyfikatory
Warianty tytułu
Języki publikacji
PL
Abstrakty
PL
Wczesne podejścia do zagadnienia translacji automatycznej bazowały głównie na regułach. Starano się wówczas ująć języki naturalne w sztywne karby gramatyki formalnej oraz wypracować jednoznaczne reguły transferu z gramatyki języka źródłowego przekładu do gramatyki języka docelowego. Jednak badania wykazały, że języki naturalne różnią się w dość istotny sposób od języków formalnych, w związku z czym wymagają nieco odmiennego potraktowania. Główna różnica polega na tym, że w językach naturalnych występują zbitki wyrazowe - tzw. związki frazeologiczne, których przekładu nie można dokonać, operując na poziomie pojedynczych wyrazów, ale które muszą być tłumaczone w sposób idiomatyczny. Dlatego w latach 90. zaproponowane zostały alternatywne podejścia, które wykorzystują istniejący dotychczas dorobek translatorski i wzorując się na nim starają się dokonać przekładu zupełnie nowych tekstów. Jednym z takich podejść jest translacja oparta na statystyce matematycznej. W artykule omówiono istotę tego podejścia oraz pokazano na podstawie przykładów, w jaki sposób należy budować statystyczne modele języka i translacji.
EN
Early phase machine translation systems were based mainly on the set of rules. The scientists tried to describe natural languagies with the set of fixed rules of a formal grammar and to formalise the proces of syntactic transfer from the grammar of one language into another. But as it was proved the natural languages differ much from formal languages so thay must be managed in some different way. The main difference between natural and formal languages is that in any natural language there exist chunks of words that can not be translated on the level of single words but they maust be treated in an idiomatic way. In the 90s some alternative approaches to machine translation were proposed that take the advantage of existing bilingual corpora of texts written in source and target languages. One of them is Statistical-Based machine Translation (SBMT). In the paper the most important issues of SBMT were described and it was presented on some useful examples how to build statistical models of natural language and the model of translation between different languages.
Rocznik
Strony
225--231
Opis fizyczny
Bibliogr. 6 poz.
Twórcy
autor
  • Katedra Automatyki, Akademia Górniczo-Hutnicza al. Mickiewicza 30, 30-059 Kraków
Bibliografia
  • [1] Arnold D., Balkan L., Meijer S., Humphreys R.L., Sadler L., Machine translation: an introductory guide, NCC Blackwell, London 1994.
  • [2] Somers H., EBMT seen as case-based reasoning, MT Summit VIII, Santiago de Compostela 2001.
  • [3] Menezes A., Richardson S., A best-first alignment algorithm for automatic extraction of transfer mapping from bilingual corpora, MT Summit VIII, Santiago de Compostela 2001.
  • [4] Ney H., Niessen S., Och F.J., Sawaf H., Tillmann C., Vogel S., Algorithms for statistical translation of spoken language, IEEE Transactions on Speech and Audio Processing 2000, 8, 24-35.
  • [5] Knight K., A statistical MT tutorial workbook, JHU Summer Workshop, 1999.
  • [6] Waibel A., Geatner P., Tomokiyo L.M., Schultz T.. Woszczyna M., Multilinguality in speech and spoken language systems, Proceedings of the IEEE 2000, 88, 1297-1313.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG4-0035-0042
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.