Warianty tytułu
Rules Induction for Information Extraction from Semistructured Data Sources
Języki publikacji
W artykule przedstawiono zagadnienia tworzenia systemów pozyskiwania informacji z Internetu. Systemy takie wykorzystują zindywidualizowane procedury wydobywania i konwersji danych. Autor prezentuje możliwości indukcyjnego uczenia się reguł wydobywania informacji z semistrukturalnych źródeł internetowych jako jeden ze sposobów tworzenia konwerterów oraz charakterystykę wybranych klas konwerterów i możliwości sterowania ich działaniem za pomocą reguł.
With the Web, computer users have gained access to large variety of economic information sources: stock-exchange-services, catalogues of products, bank-services. However the Web is based on a browsing paradigm that make it difficult to retrieve data from multiple sources. The paper presents possibilities inductive learning of rules for information extraction from semistructural data sources. (original abstract)
Opis fizyczny
- Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach
- Ashish N., Knoblock C.: Wrapper Generation for Semistructured Internet Sources. In Suciu D., ed., Proceedings of the Workshop on Management of Semistructured Data. Tucson, Arizona 1997.
- Cohen W.W.: A Web-based Information System that Reasons with Structured Collections of Text. In Proceedings of Autonomous Agents-98, 1998.
- Filipczyk G., Gołuchowski J,: Dokumenty WWW jako źródło wiedzy dla inteligentnych systemów informatycznych zarządzania. W: Baborski A. (red.) Pozyskiwanie wiedzy z baz danych. Akademia Ekonomiczna, Wrocław 2000.
- Hammer J., Garcia-Molina H., Cho J., Crespo A.: Extracting Semistructured Information from the Web. In Suciu D., ed., Proceedings of the Workshop on Management of Semistructured Data. Tucson, Arizona 1997.
- Kushmerick N.: Wrapper Induction for Information Extraction. Ph.D. Dissertation, Dept of Computer Science & Engineering, Univ of Washington. Technical Report UW-CSE-97-11-04.
- Kushmerick N.: Wrapper induction: Efficiency and expressiveness. Artificial Intelligence 118 (2000) 15-68.
- Liu L., Pu C., Han W., Buttler D., Tang W.: Building an Extensible Wrapper Repository System: AMetadata Approach. 1999.
- Muslea I., Minton S., Knoblock C.: A Hierarchical Approach to Wrapper Induction. 3rd Conference on Autonomous Agents 1999.
- Muslea I., Minton S., Knoblock C.: Active Learning for Hierarchical Wrapper Induction. Student abstract at AAAI-99.
- Muslea I., Minton S., Knoblock C.A, Hierarchical Wrapper Induction for Semistructured Information Sources. Journal of Autonomous Agents and Multi-Agent Systems (special issue on "Best of Agents'99").
- Soderland S.: Learning to Extract Text-based Information from the World Wide Web. In Proceedings of Third International Conference on Knowledge Discovery and Data Mining, 1997.
Typ dokumentu
Identyfikator YADDA