Artykuł podejmuje tematykę archiwizacji Internetu oraz wartościowania witryn internetowych. Rozpoczyna się od zdefiniowania i ustalenia struktury witryny internetowej, w skład której wchodzą strony internetowe i dokumenty HTML. W dalszej części artykułu autor podjął próbę stworzenia podziału witryn internetowych ze względu na ich charakter. Następnie przy wykorzystaniu metod archiwistyki przeprowadził rozważania nad wartością źródłową witryn internetowych. Ostatnią część artykułu stanowi studium przypadku, w którym analizie poddana została witryna internetowa I Liceum Ogólnokształcącego im. Mikołaja Kopernika w Toruniu.
EN
The article touches the subject of archiving the Web and evaluating websites. It starts with defining and presenting a structure of a website, comprising of web pages and HTML documents. Further the author attempts to divide websites according to their character. Then, using methods of archival science, the author considered source value of websites. The last part of the article is a case study analysis of the website of the Nicolaus Copernicus High School No. 1 in Toruń.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
W artykule podjęte zostały rozważania nad ogólną charakterystyką zasobów znajdujących się w różnorodnych archiwach Webu. Zrozumienie problemu postawionego w tytule wydaje się być kluczowe dla refleksji nad tym nowym rodzajem źródeł oraz wykorzystaniem ich w późniejszych badaniach. Użytkownik chcący zagłębić się w dawną Sieć musi wiedzieć, co przechowują tego rodzaju cyfrowe repozytoria i jaki jest charakter tych zbiorów. Problem ten został przedstawiony na dwóch płaszczyznach, które wynikają z dwóch etapów archiwizacji Webu – selekcji i gromadzenia. Pierwszy aspekt – teoretyczny zależy przede wszystkim od gromadzenia zasobów metodą harvestingu, czyli z wykorzystaniem crawlerów. Ich możliwości oraz ograniczenia przekładają się na to, co zostanie zarchiwizowane i jaka będzie tego postać. Należy odnotować fakt, iż prowadzi to do pewnego przekształcenia zasobów Sieci, a więc po zarchiwizowaniu nie będą już one dokładnie tym, czym były wcześniej. Drugi aspekt – praktyczny jest efektem selekcji, a więc wszystkich decyzji podejmowanych przez pracowników archiwum przed rozpoczęciem gromadzenia. Zaliczyć można do nich m.in. określenie celu i zakresu archiwizacji oraz wybór strategii pozwalających je realizować. W tekście przedstawione zostały dwie podstawowe metody – archiwizacja masowa oraz selektywna. Znaczącym utrudnieniem dla użytkowników archiwów Webu jest brak informacji dotyczący stosowanych kryteriów selekcji lub logów crawlera. Zasoby dawnej Sieci mogą stanowić pewnego rodzaju zagadkę, ponieważ nie zawsze można wskazać, co się w nich znalazło, a co nie, i jaka była tego przyczyna.
EN
The article contemplates general characteristics of holdings of various Web archives. Understanding the problem formed in the title seems to be crucial for reflections on this new type of sources and using it research. A user aiming at familiarizing with the old Web must know what is stored in this type of digital repositories and what characterizes these holdings. The problem was presented on two levels, related to two stages of archiving – selection and acquisition. The first aspect, of theoretical character, depends mostly on gathering sources using the method of harvesting (with crawlers). Their capabilities and limitations result in what will be archived and in what form. It must be noted, that this can lead to a certain deformation of Web sources, thus after archiving they will not be exactly what they were before. The second aspect, of practical character, is an effect of selection, i.e. all decisions made by archives’ employees before the process of gathering starts. These decisions comprise of, among others, specifying the aim and scope of archiving and choosing strategies to accomplish them. The text presents two basic strategies – mass archiving and selective archiving. An important obstacle for Web archives users is lack of information about selection criteria or crawlers’ logs. Holdings of the old Web can be a kind of mystery, because not always one can describe, what is in them and what is not, and what is the reason for this state.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.