Dostępne lingwistyczne definicje sylaby nie umożliwiają jednoznacznego podziału wyrazów na sylaby. Dotyczy to w szczególności języka polskiego, w którym występują liczne wieloelementowe grupy spółgłoskowe niespotykane w innych językach. Niniejszy artykuł dotyczy programu komputerowego (rozwijanego przez autora) przeznaczonego dla dzielenia tekstów w języku polskim na sylaby. Działanie tego programu opiera się na wynikach wcześniejszych badań autora, które wykazały istotne znaczenie zarówno fonologii, jak i morfologii dla procesu dzielenia wyrazów na sylaby. Badania te wykazały, że podział wyrazów w języku polskim prawie zawsze można oprzeć na zasadach fonologicznych, jednak w niektórych przypadkach morfologia sugeruje inny podział. Dlatego podstawowa procedura podziału oparta jest na regułach wynikających z fonologicznej zasady sonorności, natomiast stosowanie reguł wynikających ze struktury morfologicznej wyrazów jest opcjonalne. Artykuł dotyczy rozwiązań zastosowanych w programie – przede wszystkim omówiona została struktura reguł podziału. Publikacja porusza również problem różnic między zapisem ortograficznym i transkrypcją ortograficzną w języku polskim. Ten problem jest istotny, ponieważ proces dzielenia na sylaby dotyczy tekstów ortograficznych, natomiast wartości fonologicznej sonorności są przypisywane do dźwięków mowy.
EN
According to the current definitions of a syllable it is impossible to syllabify words in an unambiguous and uncontroversial manner. This especially concerns languages such as Polish, which is rich in long consonant clusters, rarely occurring in other languages. The article describes computer software currently being developed by the author to divide Polish texts into syllables. The program is based on the findings of the author’s previous research, which point to the significance of both phonology and morphology for syllabification in Polish. Investigation has shown that syllabification may, in most cases, be based mostly on phonology, but sometimes morphology suggests different solutions. Therefore the main syllabification procedure is based on the phonological principle of sonority, with an optional syllabification procedure based on the morphological structure of words. The article outlines the solutions employed in the program – mainly the structure of syllabification rules. Attention is also drawn to the differences between orthographic spelling and phonological transcription in Polish, which is important due to the fact that the syllabification program operates on orthographic words, while phonological sonority values are applicable to speech sounds.
This paper presents a model for the syllabification of Polish words written in orthographic form. It raises some significant issues related to syllabification, including the linguistic definition of a syllable and certain phonological principles: the Sonority Sequencing Principle and the Maximal Onset Principle. The article describes the steps of a designed syllabification procedure. This procedure provides four layers of syllable boundary placement. The first layer is related to the morphological structure of the word (it concerns mainly boundaries between a prefix and a stem). The structure of the rules in the first layer is based on the initial and final strings in words. The goal of the second layer is to put boundaries between syllable nuclei. The next layer modifies the boundaries that result from the phonological principles. The last layer places boundaries resulting from the phonological principles. Rules applied earlier mask rules on the succeeding layers. The article also presents a structure of rules based on probability. A description of static syllabification systems is also given - these work much faster, but it is not possible to modify the rules associated with them. The last described feature of the presented solution is the ability to create generative systems.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.