In both written and spoken languages, we sometimes use different words in order to describe the same thing. For Instance, we use "candidacy and "running in an election" as the same meaning. This makes text classification, event tracking and text summarization difficult. In this paper, we propose a method to extract words which are semantically similar to each other accurately. Using this method, we extracted similar word pairs from newspaper articles. Furthermore, we performed sentence extraction from the newspaper articles using the extracted similar word pairs. We hypothesized that the headline is salient information of the newspaper article and presence of headline terms in the article can be used to detect salient sentences of news text. By using similar words in the headline, we obtained better results than that without using it. The results suggest that our method is useful for text summarization.
Celem artykułu jest pokazanie zmian w formie nagłówków w czasie ostatniego półwiecza. Materiał badawczy pochodzi z „Gazety Wyborczej” wydawanej w latach 1996–1997, a następnie w latach 2015–2016. Punktem odniesienia (porównania) są wyniki badań nad prasą lat sześćdziesiątych. Autorka koncentruje się szczególnie na wartości informacyjnej nagłówków i ich postaci składniowej. Analizuje nagłówki ze względu na rodzaj przekazywanej informacji w trzech przedziałach czasowych. Pod uwagę bierze: precyzowanie treści utworu (streszczanie najważniejszej wiadomości lub tezy utworu, określanie tematu utworu), uwydatnianie głównej okoliczności, wskazywanie odbiorcy. Badania wykazały, że w nagłówkach ostatnich dwudziestu lat powstały nowe schematy składniowe, np. schemat nagłówka w postaci replik dialogowych, a istniejące schematy zostały rozbudowane. Dotyczy to zwłaszcza grupy informacyjnej „wskazanie odbiorcy”. Stosowane w nagłówkach kategorie gramatyczne służą zaktywizowaniu odbiorcy, co zwiększa interakcyjność przekazu. Cytaty wprowadzają różnorodność głosów i perspektyw, co kreuje nowe sytuacje komunikacyjne. Zmiany w językowej formie nagłówków mają charakter jakościowy i ilościowy. Są przejawem zmian w sferze publicznej i dyskursie medialnym.
EN
The aim of the article is to present the changes in the form of headlines over the past 50 years. The research material has been obtained from Gazeta Wyborcza (in 1996–1997 and 2015–2016). It is compared to the research on press conducted in the 1960s. The author of the article concentrates especially on the informational value and the syntactic structure of the press headlines. She analyzes the headlines with regard to the information included, in the three time intervals. She takes it into consideration how the headlines specify the content of the article (whether they summarize the most important information or thesis or define its topic), how they highlight the main circumstance, how they designate the addressee of the text. The research has shown that among the headlines used during the past 20 years, there emerged new syntactic schemes, e.g. that of the dialogical response, and that the existing schemes have been expanded. This concerns especially the headlines which designate the addressee of the text. The grammatical categories used in the headlines serve mainly to activate the readers, which leads to a greater attractiveness of the text. Quotations introduce the variety of voices and perspectives, which creates new communicative situations. The changes in the linguistic form of the headlines are both qualitative and quantitative, and are an indicator of the changes in the public sphere and in the media discourse.
W artykule zaprezentowano wyniki analizy struktury wiadomości zagranicznych na łamach dziennika „New York Times” w latach 1989-2014. Materiał badawczy zebrany na potrzeby badań stanowiły nagłówki działu zagranicznego nowojorskiego dziennika (ok. 25 tys.), które uporządkowano w zbiór tekstowy. Ilościowa analiza leksykalna (pomiary frekwencyjności, badania konkordancji określonych wyrazów wraz z ich kontekstami, wybrane kolokacje najistotniejszych wyrazów, a następnie analiza zawartości posłużyły do rekonstrukcji wzorów współwystępowania określonych wyrazów, a tym samym stały się podstawą rekonstrukcji wzajemnych związków i wzorów współwystępowania określeń odnoszących się do osób, przedmiotów, cech, czynności, stanów jako podstawowych elementów różnorodnych narracji o świecie na łamach „New York Timesa”.
EN
The aim of the article is to present the results of the survey on the structure of foreign news present in the headline of “The New York Times” in 1989-2014. An analysis performed in this research was the lexical analysis of the daily’s headlines gathered in the text corpus. The results of statistical evaluations were the words frequency lists, the analysis of certain words concordances and collocations. The effect of such procedure was the reconstruction of important words co-occurances common patterns. In this phase of the survey, the units of analysis were words, so the intensity of the analyzed text attributes were measured by the number and percentage range of certain words. The next phase of the survey was the computer assisted content analysis (CACA). Finally, as a result of factor analysis, the structure of the discourse on the world in “NYT’s” headlines was reduced to 25 strongest factors determining which different (detailed) categories have the tendency to co-occur and that is why they create easily distinguishable configuration.
Information gap is the effect of interpretation appeared when rises the space between receivers knowledge needed to understand the communicate and the knowledge that receiver already has (his interpretative base). This space could be unfavourable for the receiver, but beneficial for the sender. The mechanism helps him to navigate receivers behaviour for seeking additional information, that will help the last to fill unpleasant information gap. In the article is being tested the hypothesis that utterances constructed in special way could generate information gap and because of that, they could release higher curiosity than utterances full of information needed to understand the meaning of the utterance. According to the results of language analysis the survey was held. Results of questionnaire validated the hypothesis – more interesting are this utterances that could generate information gap.
PL
W artykule przyjmuje się, że luka informacyjna to pojawiający się w procesie interpretacji efekt, powstający wówczas, gdy tworzy się przestrzeń między wiedzą niezbędną do przeprowadzenia operacji dopełnienia sensu w procesie interpretacji komunikatu a wiedzą już posiadaną przez odbiorcę (jego bazą interpretacyjną). Ta przestrzeń może być niekorzystna z punktu widzenia odbiorcy, ale korzystna dla nadawcy. Jest to bowiem mechanizm, który pozwala nadawcy sterować działaniem odbiorcy w kierunku poszukiwania przez tego ostatniego dodatkowych informacji, które pozwolą zapełnić lukę informacyjną. W artykule testuje się hipotezę, że komunikaty charakteryzujące się określoną konstrukcją generują lukę informacyjną i przez to są postrzegane jako wywołujące większe zaciekawienie niż komunikaty pełne informacyjnie. Przedstawione są także rezultaty przeprowadzonego przez autorkę badania językowego oraz sporządzonej na potrzeby badania ankiety. Przyjęta hipoteza badawcza została potwierdzona w badaniu – większym zainteresowaniem cieszyły się tytuły, które generowały lukę informacyjną.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.