Wyniki wyszukiwania - BazTech

Ograniczanie wyników

1 2012

Znaleziono wyników: 1

Liczba wyników na stronie

Wyniki wyszukiwania

Wyszukiwano:
w słowach kluczowych: web pages contents recognition

Sortuj według:

Ogranicz wyniki do:

Algorytm wykrywania treści na stronach portali internetowych

Ulman K., Rzecki K.

Czasopismo Techniczne. Nauki Podstawowe

2012

R. 109, z. 1-NP

101--110

W artykule przedstawiono podejście wykorzystane podczas projektowania i implementowania algorytmu automatycznego wykrywania treści na stronach portali internetowych oparte o analizę struktury kodu HTML strony WWW. Za treść strony uznano tekst artykułów wraz z jego nagłówkiem, z pominięciem innych tekstów występujących na stronie (menu, reklamy, komentarze, podpisy pod zdjęciami, itp.).

The paper shows steps, made during designing and implementing automatic web pages contents recognition algorithm, based on HTML structure analysis. A web page contents is the article text with its headline, without any other text like menu, advertisements, user’s comments, image captions, etc.