Warianty tytułu
Samorozpakowujące się skompresowane dokumenty HTML
Języki publikacji
Abstrakty
Kompresja danych jest naturalnym sposobem usunięcia pewnych niedogodności związanych z tekstową reprezentacją danych. W szczególności, kompresja umożliwia przyspieszenie transferu danych w sieci WWW. Choć liczba istniejących rozwiązań kompresujących dane w formacie HTML (i innych formatach webowych) jest znaczna, mają one większy praktyczny sens tylko wtedy, jeśli są one transparentne dla końcowego użytkownika, a pożądaną cechą jest także brak konieczności instalacji dodatkowych pluginów w przeglądarce internetowej. W pracy przedstawiamy algorytm kompresji HTML oparty na klasycznej idei słownikowej (substytucji fraz), z wykorzystaniem dekompresora w JavaScript, który uruchamia się tuż po załadowaniu strony i odtwarza jej oryginalną zawartość. Algorytm ten działa w dowolnej przeglądarce internetowej z włączoną obsługą JavaScript. Eksperymenty pokazują, iż algorytm ten, w połączeniu z klasyczną ideą usuwania nadmiarowych symboli (białe znaki), komentarzy w HTML itp., prowadzi do zmniejszenia oryginalnego rozmiaru dokumentu do około połowy.
Data compression is a natural means to overcome some issues with textual data, in particular, it can accelerate the transfer of web data. Although the number of possible solutions to compress HTML and other web documents is not small, it makes practical sense if the compression scheme is transparent for the user and preferably does not require any plugins or other modifications of a standard web browser. In this paper we present a substitution-based HTML compression algorithm with a JavaScript decompression stub which is launched upon page load and restores the original data, thus working transparently for the client, if only JavaScript execution is turned on. Experiments show that together with visually lossless HTML preprocessing, HTML can be shrunk to about the half of their original size.
Rocznik
Tom
Strony
599-608
Opis fizyczny
Bibliogr. 10 poz., wykr., tab.
Twórcy
autor
- Institute of Information Technology in Management, University of Szczecin, Poland, jakubs@uoo.univ.szczecin.pl
autor
- Computer Engineering Department, Technical University of Lodz, Poland , sgrabow@kis.p.lodz.pl
Bibliografia
- [1] Absolute HTML Compressor, v. 1.14, http://www.alentum.com/ahc/ [accessed June 2010].
- [2] Fielding R. et al, RFC 2616, Hypertext Transfer Protocol — HTTP/1.1. June 1999. Available at http://www.http-compression.com/rfc2616.txt.
- [3] Lighttpd, home page. http://www.lighttpd.net/ [accessed June 2010].
- [4] Netcraft May 2010 Web Server Survey. http://news.netcraft.com/archives/category/web-server-survey/ [accessed June 2010].
- [5] Opera Turbo, http://www.opera.com/business/solutions/turbo/ [accessed June 2010].
- [6] Opera Turbo Report, March and April 2010. http://www.opera.com/otr/ [accessed June 2010].
- [7] Skibiński R, Yisually Lossless HTML Compression. lOth Int. Conference on Web Information Systems Engineering (WISE), LNCS 5802, Springer 2009, 195-202.
- [8] Skibiński R, Improving HTML Compression. Informatica (Slovenia) 33(3), 2009, 363-373.
- [9] Skibiński R, Grabowski Sz., Swacha J., Effective asymmetric XML compression. Software-Practice and Experience 38(10), 2008, 1027-1047.
- [10] Skibiński R, Swacha J., Grabowski Sz., A Highly EfficientXML Compression Schemefor the Web.34th Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM), LNCS 4910, Springer 2008, 766-777.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-AGH1-0025-0091