Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 24

Liczba wyników na stronie
first rewind previous Strona / 2 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  corpus analysis
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 2 next fast forward last
EN
The article focuses on prepositional word phrases that are considered usualised and lexicalised word compounds. Lexicalisation is marked by the zero article between the preposition and the noun. Their meaning is compositional, so they do not affect correct comprehension in receptive language skills. In the productive language skills, non-native speakers often have problems because the lexicalisation processes are unique to each language. The lexicographical description only takes very limited account of such usualised word phrases, often they are not even mentioned in the dictionaries, although they form an integral part of communication. In the article, these word compounds are examined in the meaning of the medium in the digital environment. Their formal properties – preference of the individual prepositions with base words internet, email, chat and SMS – are examined to determine which of the word compounds is most frequently used in communication. The qualitative analysis of the corpus evidence shows in turn whether the word compounds studied can be considered synonymous. This can be analysed on the basis of the typical contexts of studied compounds, which is possible by analysing their verbal collocates. Such analyses of electronic corpora show the concrete preferences on the quantitative and qualitative levels and contribute to a better formal, semantic, lexicographic and linguistic-practical description of the word phrases. The article emphasises the importance of corpus linguistic approaches in current linguistics.
|
|
tom 13
383-401
EN
The article aims to specify the period in which the gerund in Portuguese has given way to a + infinitive construction in syntactic positions in which the infinitive predominates also in the contemporary European Portuguese (periphrastic formations estar a + infinitive, ficar a + infinitive, continuar a + infinitive and andar a + infinitive, in semi‑predicative clauses). In this analysis the electronic corpus (www.corpusdoportugues.org) was used. The analysis shows that the period sought must be located in the 19th century (or slightly before), when the infinitive construction starts to appear with greater frequency than in previous centuries.
|
|
tom 13
|
nr 1
179-217
EN
This paper reports on the creation of specialized word lists in traditional Chinese medicine (TCM), which is a discipline using vocabulary across languages (i.e., Chinese and English) and involves learners with different L1 backgrounds. First, a TCM Word List of 2,778 specialized words was established from corpora of TCM textbooks and journal articles. Selection criteria included specialized meaning, keyness in a corpus of general written English compared to the TCM Corpora, and frequency. The resulting TCM list covered 36.65% of the TCM Corpora but had low coverage over corpora of general written English and medical English. The TCM Word List was then divided into three sub-lists based on frequency, and graded into three levels. Level 1 contains high-frequency lexical items in English (e.g., organ, coating); Level 2 contains items that are mid-, low-frequency, or beyond any frequency levels (e.g., pericarpium, metabolism); and Level 3 contains Chinese loan words (e.g., qi, yang). Last, there is an overlap of 309 word families between this list and an earlier TCM list by Hsu (2018), which excludes words from the 1st-3rd 1,000 word families in English. Suggestions for teachers and future research are provided.
|
2020
|
tom 32
233-257
EN
This paper investigates an attempt to apply a corpus analysis to the development of the intercultural approach to foreign language teaching through the semantic analysis of cultural keywords. Our analysis will specifically include the process of discovering the meaning of the three words: French politesse and its Polish equivalents - grzeczność and uprzejmość through their collocations collected in French and Polish corpora. As a result, firstly, we came up with a conclusion that the French word politesse is characterized by more positive semantic prosody than its Polish equivalents. Secondly, politesse appears more frequently in coordinate collocations with nouns conveying aesthetical meaning, whereas the Polish word uprzejmość is more frequently used with nouns designating ethical features. The principles of our methodology or some data used in our research can inspire the introduction of an inductive lexical approach in foreign language teaching to facilitate the conceptualization of complex cultural notions, which is the essential of the intercultural teaching.
|
2019
|
tom 28
41-52
EN
The article documents cases of grammatical, phonetic and lexical “irregularities” occurring in modern Russian. The conclusions are based on analysis of the National Corpus of the Russian Language and internet queries. The author pays special attention to phrases indicating time relations: “for some time” / “after what time”. It is noted that there is an “older” and “younger” standard for using collocations with the lexeme „time” and prepositions, and the change in the norm resulted from the transition from treating space-time as an abstract, uniform chronotope to the idea of time as a discrete quantity, i.e. certain fragmented, countable sections (century, year, month, day, hour, minute, second). Research has shown that discrete forms denoting time began to dominate from the mid-nineteenth century, which is related to the changes in the image of the world taking place at that time. The old ways of speaking about time, however, still appear in modern Russian. The article shows that other lexical and inflectional archaisms (e.g. short forms of adjectives) are also returning to modern speech. This can be considered a manifestation of social linguistic memory, which involves having the ability to recall and use old forms or meanings, according to norms that used to be applied in the past. The author proposes that this phenomenon be called “spontaneous recurrence of the norm”. It is claimed that such recurrence of the old norm may be caused either by speakers’ ignorance of the current norm or by their desire for a “retro” style that results from fashion or manners. It could also be a manifestation of “language refreshment” through the activation of speech memory, or retrieving former forms and old standards out of the “subconscious” of language users.
|
2021
|
tom XXIII/1
123-140
EN
The goal of this article is to examine the issue of gender neutrality of job classifieds in contemporary German language using the results of empirical analysis of a research corpus. In light of the General Act on Equal Treatment (Allgemeines Gleichbehandlungsgesetz – AGG) adopted by German Bundestag on the 14th of August, 2006, as well as the Act Modifying the Information to be Entered into the Birth Register (Gesetz zur Änderung der in das Geburtenregister einzutragenden Angaben) of the 18th of December, 2018, there is an obligation in Germany to edit job classified in accordance with gender neutrality. The implementation of linguistic equality of the sexes in job ads in such a way that they meet the guidelines of the AGG often leads to linguistic chaos and wrong and/or confusing phrasing: a fact confirmed by the examples from the above mentioned corpus. These phenomena have a considerable impact on the readability and the aesthetic qualities of the ads, and on the possibility of understanding them both in the written form and as audio files. To some extent, they also determine the degree of success of the recruitment process. Gender neutrality in language consists in expressing both male and female genders as well as other gender-related identities. However, this has to be done in accordance with grammatical, syntactic and stylistic norms. In order to prevent the “job classified” genre of texts from being misunderstood, unclearly phrased names of jobs must be eliminated.
7
Content available remote ENGLISH LOANS IN EVERYDAY CONVERSATIONAL POLISH. A CORPUS STUDY
75%
EN
The purpose of the study was to gauge the extent to which early 21st-century general Polish, spoken and written, was saturated with English lexical material. English lexical loans extracted from an over 58-hour recording of everyday conversational Polish were analysed with the use of the NKJP corpus tools (nkjp.pl). The findings are broadly consistent with the results of previous, micro-corpus-based research in that English lexical influence on the turn-of-the-millennium Polish appears to have been much less extensive than is commonly believed.
PL
Zapożyczenia angielskie z ponad 58 godzin polskich rozmów codziennych poddano analizie korpusowej (nkjp.pl) w celu ustalenia stopnia nasycenia anglicyzmami polszczyzny ogólnej w odmianie mówionej i pisanej. Wyniki są zgodne z ustaleniami wcześniejszych badań, w których korzystano z mikro-korpusów: anglicyzmów w polszczyźnie ogólnej przełomu tysiącleci było znacznie mniej niż się często sadzi.
|
|
nr 9
73-89
PL
This article presents the results of an analysis covering a portion of the vocabulary found in Wacław Potocki’s literary works. The examination of the lexical structure of the poet’s writings was limited to the biblical proper names coming from the three-volume edition of the poet’s Dzieła (Works) (Kukulski 1987). The material was excerpted using the corpus method and the Electronic Corpus of 17th- and 18th-century Polish Texts (until 1772). The aim of this article is to divide the collected biblisms according to the onomastic classification and to discuss the findings of their functional analysis. The Bible was a significant source of creative and ideological inspiration for the 17th-century author, which was reflected in the presented collection of proper names, with the anthroponyms that fulfilled allusive and content functions winning the greatest share. The study is concluded with a compilation of the outcomes of the comparative analysis performed with regard to the frequency of biblical proper names, certified in W. Potocki’s Dzieła and in the corpus of Baroque texts.
EN
The aim of the article is to analyze short forms of adjectives in Czech in the context of their long equivalents. The research material was collected from the corpus of the Czech language, SYN2015. Native adjectives are statistically on the margins of the Czech language. They appear in specific grammar and lexical constructions. Therefore, they occupy a permanent place in the Czech system. They are used not only in literary statements, as the Czech grammar shows, but also in colloquial literary language (e.g. a hotovo). The short forms of adjectives most often perform the function of a predicate or predicative, more rarely an incongruent attribute, adverbial or independent element. Some adjectives occur in established language connections (e.g. pokud možno, buď tak laskav, buď zdráv).
PL
Celem artykułu jest analiza form krótkich przymiotników w języku czeskim w kontekście ich złożonych odpowiedników. Materiał badawczy został zebrany z równoważnego korpusu języka czeskiego SYN2015. Przymiotniki imienne znajdują się pod względem statystycznym na marginesie języka czeskiego. Występują w konkretnych konstrukcjach gramatycznych i leksykalnych. Zajmują zatem stałe miejsce w systemie czeszczyzny. Są stosowane w wypowiedziach literackich, nie tylko książkowych, jak wskazują na to gramatyki języka czeskiego, ale nieraz także w potocznym języku literackim (np. a hotovo). Przymiotniki imienne najczęściej pełnią funkcję orzecznika lub predykatywu, rzadziej okolicznika, przydawki niekongruentnej lub członu samodzielnego. Część przymiotników imiennych występuje w ustalonych połączeniach językowych (np. pokud možno, buď tak laskav, buď zdráv).  
11
Content available remote Polska — Rosja: wzajemne wartościowanie (na podstawie analizy korpusowej)
63%
EN
The author considers value and evaluation in the perspective of intercultural and anthropological linguistics. The value is treated as an element of axiological modality, which is specific in every language community. This particularly applies to the subjectively valued national groups and the stereotypes based on the values. Corpus analysis deals with exposing the values attributed to Poles by the Russians and, conversely, attributed to the Russians by the Poles. The author has taken into account a set of the facets (cognitive domains), such as politics, society, economy and commerce, language, art and other. The results of the expedition have been worked out in the quantitative and qualitative way.
EN
This article presents the results of discourse analysis conducted on three language corpora, Polish Trends, corpus of press texts, and corpus of tweets, exploring the topic of generative artificial intelligence, particularly ChatGPT. The aim of the investigation was to verify whether the Polish online discourse on AI could be characterised as a moral panic and whether the premises present in the discourse indicate active societal reflection on issues of trust in the technology itself and the content it generates. The analysis revealed that the discourse on AI involves moderate anxiety, which is reasonable – authors of the analysed articles and statements reflect on the real consequences of the popularisation of generative AI, including the issue of lack of adequate digital competencies to have a sense of control over it. This article emphasises the need to extend expert and academic reflections to a societal perspective, including awareness of the main threads and societal concerns raised at the level of discourse. This analysis gives a voice to society, underscoring the role of ordinary users in the assumptions of Trustworthy AI and building trust in new technologies, referring to Michael Foucault’s concept of knowledge-power and Shoshana Zuboff’s surveillance.
PL
Niniejszy artykuł prezentuje wyniki analizy dyskursu przeprowadzonej na trzech korpusach językowych – Polish Trends, korpusie tekstów prasowych i korpusie tweetów – eksplorując temat generatywnej sztucznej inteligencji, w szczególności Chatu GPT. Celem badania była weryfikacja, czy polski dyskurs internetowy na temat SI może być określany jako panika moralna, a także czy obecne w nim przesłanki wskazują na aktywną refleksję społeczną nad kwestiami zaufania wobec samej technologii, jak i wytwarzanych przez nią treści. Analiza wykazała, że w dyskursie o SI mamy do czynienia z umiarkowanym niepokojem, któremu nie brakuje podstaw – autorzy analizowanych artykułów oraz wypowiedzi zastanawiają się nad realnymi konsekwencjami popularyzacji generatywnych SI, w tym kwestią braku odpowiednich kompetencji cyfrowych, aby mieć nad nią poczucie kontroli. Artykuł ten akcentuje potrzebę rozszerzenia refleksji eksperckich i akademickich o perspektywę społeczną, w tym świadomość głównych wątków i obaw społecznych podnoszonych na poziomie dyskursu. Niniejsza analiza oddaje głos społeczeństwu, podkreślając rolę zwykłych użytkowników przy założeniach idei Trustworthy AI oraz w budowaniu zaufania do nowych technologii, odnosząc się do koncepcji wiedzy–władzy Michaela Foucault oraz kapitalizmu nadzoru Shoshany Zuboff.
EN
The linguistic overview of the word holiday in the three languages (French, Lithuanian and Polish) is promising for the intercultural approach to teaching French as a foreign language with a view to go beyond the roughly monocultural contexts in Poland and Lithuania. The research is based on text corpora in these three languages. Its objective is to analyse the linguistic images of the word holiday and its Lithuanian and Polish equivalents and to examine their collocational (non)coincidence in order to systematize the teaching/learning of collocations to French learners. The aim would be to help students retain meaning and lexical association simultaneously, as well as to fix the structures they already partially know and to discover (inter)cultural aspects.
|
|
nr 1
1-25
EN
In the interpretation of criminal law, an important role is played by the presumption of the common (general, colloquial) meaning of statutory expressions. Determining the common meaning in the process of applying the law is usually based on the linguistic intuition of the procedural authority or on dictionaries. In the article, we present an alternative sourceof knowledge about the common meaning of linguistic corpora. The use of corpora as a tool of legal interpretation has been intensively discussed in American literature for several years. The main objections are raised in the context of criminal law. The article reviews the main arguments raised in the American debate and relates them to Polish legal culture. Moreover, some exemplary corpus analyzes in criminal cases are presented, both in the context of legal interpretation and the assessment of linguistic elements of the facts of the case.
PL
W interpretacji prawa karnego dużą rolę odgrywa domniemanie znaczenia powszechnego (ogólnego, potocznego) wyrażeń ustawowych. Ustalanie znaczenia powszechnego w procesie stosowania prawa odbywa się zwykle na podstawie intuicji językowej organu procesowego lub słowników. W artykule przedstawiono konkurencyjne źródło wiedzy o znaczeniu powszechnym, jakim są korpusy językowe. Wykorzystanie korpusów jako narzędzia wykładni prawa jest od kilku lat intensywnie dyskutowane w literaturze amerykańskiej. Główne zastrzeżenia zgłaszane są w kontekście prawa karnego. Artykuł zawiera przegląd głównych argumentów podnoszonych w amerykańskiej debacie i odniesienie ich do polskiej kultury prawnej. Ponadto, przedstawione zostały przykładowe analizy korpusowe na gruncie spraw karnych, zarówno w kontekście wykładni prawa, jak i oceny językowych elementów stanu faktycznego.
EN
A paper is focusing on discourse analysis of Czech and Polish internet discussions after case of Aquarius ship in June 2018. Author is using discourse analysis to merge all comments in one heterogenic text and to show how discussion about migration looks like in case of most Eurosceptic society of Eastern Europe (Czech Republic) and in most Eurooptimist society (Poland). Discourse analysis together with tools of quantitative analysis (software AnrConc) shows that despite differences between Czechs and Poles, both nations feels themselves as part of European community. It was shown as well, that in both nations there is strong need to find irrational explanations of migrant crisis
PL
W artykule autorka analizuje dyskurs czeskich i polskich forów internetowych po wypadku statku Aquarius w czerwcu 2018 r. Wykorzystuje metodę analizy, aby połączyć wszystkie komentarze w jeden heterogeniczny tekst i pokazać, jak wygląda dyskusja na temat migracji w większości społeczeństwa eurosceptycznego Europy Wschodniej (Republika Czeska) i w większości społeczeństwa eurooptymistycznego (Polska). Analiza dyskursu wraz z analizą frekwencyjną (oprogramowanie AnrConc) pokazuje, że pomimo różnic między Czechami i Polakami oba narody czują się częścią społeczności europejskiej. Pokazano również, że w obu krajach istnieje silna potrzeba znalezienia irracjonalnych wyjaśnień kryzysu migracyjnego.
16
Content available Epistemik und Faktizität in Pressediskursen
63%
|
2018
|
nr 14
29-38
EN
The article describes a corpus research with its theoretical background. The basis of our research is a press corpus with 27 million tokens, where the epistemic terms are annotated. The grammatical and lexical epistemic expression are consistently kept apart on the basis of the relevant literature. The next step is to investigate with a fully automatic method which expressions often occur together in a text. Semantic subclasses of epistemic expressions are defined on the basis of these quantitatively proven solidarities. Finally, concrete examples illustrate how the epistemic expressions structure the text.
DE
Im Beitrag wird eine Korpusuntersuchung mit ihrem theoretischen Hintergrund beschrieben. In einem 27 Millionen Tokens starken Pressekorpus werden die epistemischen Ausdrücke annotiert. Die grammatikalisierten und lexikalischen epistemischen Ausdrucksmittel werden aufgrund der einschlägigen Literatur konsequent auseinandergehalten. Im nächsten Schritt wird mit einer vollautomatischen Methode untersucht, welche Ausdrücke häufig gemeinsam in einem Text auftreten. Aufgrund dieser quantitativ nachgewiesenen Solidaritäten werden semantische Subklassen epistemischer Ausdrücke definiert. Anschließend wird anhand konkreter Textbeispiele gezeigt, wie die epistemischen Ausdrücke den Text strukturieren.
|
|
nr 13
175–193
EN
The subject of this paper is a corpus analysis of patrimoine in contrastive perspective with its Polish equivalent dziedzictwo within the framework of the intercultural approach in French language teaching. Its purpose will be to reveal the semantic differences and similarities of these two words in terms of the results provided by the frequency and collocation analysis based on the Polish National Corpus, the French Corpus Frantext and Corpora Collection of Leipzig University. The study showed that one of the strongest and most frequent collocations, indicated by different collocation measures, for both Polish and French, is cultural heritage (Fr. patrimoine culturel, Pl. dziedzictwo kulturowe). Typical Polish collocations are national heritage and Christian heritage, while in French these are patrimoine artistique et patrimoine touristique.
|
|
nr 4
104-125
EN
The paper presents challenges faced by psychiatrists who venture into the justice system. Based on the analysis of sixty-five forensic psychiatric reports, strategies assumed by expert witnesses in order to reconcile the language of medicine with the language of law were reconstructed. Methods and tools of corpus linguistics were used, such as: frequency lists, keyword analysis, and concordance analysis. The results indicate that forensic psychiatrists have difficulty in translating the language of medicine into the language of law. They use lexis and linguistic structures characteristic of medical genres, while appropriating legal vocabulary in the form of phrases drawn from the criminal code. The tensions resulting from the collision of the legal and the psychiatric discourse have been described in terms of the clash of two types of logic: “either/or”, typical of the justice system, and “both/and”, prevalent in contemporary clinical psychiatry. This analysis has also captured ethical challenges which stem from the double role of forensic psychiatrists as doctors and as representatives of the criminal justice system. It has shown that psychiatrists focused on playing the latter role, situating themselves on the side of the law.
PL
W artykule przedstawione zostały wyzwania, z jakimi mierzą się psychiatrzy, wkraczając w obszar wymiaru sprawiedliwości. Na podstawie analizy 65 opinii sądowo-psychiatrycznych zrekonstruowano strategie uzgadniania języka prawa i języka medycyny przyjmowane przez biegłych. Zastosowano metody i narzędzia lingwistyki korpusowej: listy frekwencyjne, analizę słów kluczowych oraz analizę konkordancji. Uzyskane wyniki wskazują, że psychiatrzy sądowi mają trudności z dokonaniem przekładu z języka medycyny na język prawa. Posługują się leksyką i strukturami językowymi właściwymi dla gatunków medycznych, a słownictwo prawne przejmują w postaci związków wyrazowych zaczerpniętych z kodeksu karnego. Wprowadzając terminy prawne, próbują wypełnić je aktualną wiedzą medyczną. Napięcia wynikające ze zderzenia dyskursu prawnego i psychiatrycznego opisane zostały w kategoriach zderzenia dwóch logik: „albo, albo”, właściwej dla systemu sprawiedliwości, oraz „zarówno, jak też”, przyjmowanej we współczesnej psychiatrii klinicznej. W analizie uchwycone zostały także wyzwania etyczne związane z występowaniem przez psychiatrów sądowych w podwójnej roli – lekarzy i reprezentantów wymiaru sprawiedliwości. Wykazała ona, że biegli skupiali się na realizacji drugiej z tych ról, sytuując się po stronie prawa.
Bohemistyka
|
2023
|
tom 23
|
nr 4
541-554
EN
The goal of the study is to seek for mechanisms that determine creation of female forms of foreign surnames in Czech in the material from the Czech National Corpus SYN, version 9. To this end, we investigate the corpus frequencies of the names of European female presidents and prime ministers who were active in the 2010–2019 timespan, and of the names of actresses who received the Academy Award for Best Actress (the Oscar) in the same period. On the grounds of statistical testing, the paper finds out if profession, age, or declension of the first name play a role in whether surname feminization takes place. Besides the results, the research hints at the fact that there are many factors at play, for example, name length, spelling difficulties, or the mechanism of “syntactic attraction”.
CS
Cílem studie je hledat mechanismy, které podmiňují tvoření ženských podob cizích příjmení v češtině, a to na materiálu Českého národního korpusu SYN, verze 9. Za tímto účelem zkoumáme korpusovou frekvenci jmen evropských prezidentek a premiérek, které působily v časovém rozmezí let 2010–2019, a jmen hereček, jež ve stejném období získaly Oscara za nejlepší ženský herecký výkon. Na základě statistického testování článek zjišťuje, jestli profese, věk nebo možnost skloňovat rodné jméno hrají roli v tom, zda dochází k feminizaci příjmení. Kromě výsledků výzkum naznačuje, že ve hře je mnoho dalších faktorů, například délka jména, pravopisné obtíže nebo mechanismus „syntaktické atrakce“.
20
Content available Untersuchung adjektivischer Bildungen auf -schwanger
51%
|
2018
|
nr 14
235-242
EN
Analysis of Adjectival Formations on -schwanger The present paper is concerned with the synchronic, quantitative analysis of one aspect of adjectival word-formation. The aim of the paper is to explore the word-formation productivity of derivations ending in ‑schwanger and its frequency of occurrence in texts by taking various structure-types into consideration. I will make an attempt to identify and document the current trends in the lexis of contemporary German language by means of corpus-linguistic methods.
DE
Im vorliegenden Beitrag werden die Ergebnisse einer synchronischen Untersuchung adjektivischer Bildungen auf -schwanger vorgelegt. In der linguistischen Fachliteratur wurde dieser Wortbildungskonstruktion wegen ihrer begrenzten Produktivität bislang kaum Aufmerksamkeit geschenkt. Auch in den bekanntesten einsprachigen Wörterbüchern sind nur wenige Bildungen mit dem Suffixoid -schwanger lemmatisiert. Den Kernpunkt der Arbeit bilden die Erkenntnisse einer Korpusuntersuchung, die mit Hilfe des Deutschen Referenzkorpus des IdS Mannheim durchgeführt wurde. Das gewonnene Belegmaterial wurde einer morphologischen, syntaktischen und semantischen Analyse unterzogen. Aspekte wie Art des Basismorphems, Fugengestaltung und Fugenvarianz kommen im Beitrag ebenfalls zum Tragen. Das Ziel der Untersuchung ist es, über die Aufdeckung struktureller Eigenschaften hinaus unter Anwendung quantitativer Methoden verlässliche Aussagen über Produktivität, Verwendungsfrequenz und Neubildungspotenz des Zweitglieds -schwanger zu machen.
first rewind previous Strona / 2 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.