PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Computer system architecture for Polish-language documents search with the use of queries in a natural language

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Koncepcja architektury systemu komputerowego wyszukiwania dokumentów w języku polskim przy pomocy zapytań w języku naturalnym
Języki publikacji
EN PL
Abstrakty
EN
The article features an architecture concept of a system to search for information in text documents with the use of natural-language queries. The basic element of the proposed solution is the application of query expansion as a method to improve the quality of achieved results. As there are no such tools for the Polish language, the authors proposed how to prepare suitable assets from input data for this purpose. The prepared system will be applied for information search in specialized documents, such as technical and diagnostic documentation of mining machines.
PL
Artykuł przestawia koncepcję architektury systemu wyszukiwania informacji w dokumentach tekstowych, z wykorzystaniem zapytań w języku naturalnym. Zasadniczym elementem proponowanego rozwiązania jest wykorzystanie metody ekspansji zapytań, jako sposobu na poprawę jakości uzyskiwanych wyników. Ponieważ brak jest tego typu narzędzi dedykowanych dla języka polskiego, zaproponowano także sposób przygotowania odpowiednich do tego celu zasobów z danych wejściowych. Przygotowywany system znajdzie zastosowanie w wyszukiwaniu informacji w dokumentach specjalistycznych, jakimi są dokumentacje techniczne i diagnostyczne maszyn górniczych.
Wydawca
Rocznik
Strony
16--23 [tekst ang.], 67--75 [tekst pol.]
Opis fizyczny
Bibliogr. 21 poz., rys., tab.
Twórcy
  • Silesian University of Technology
autor
  • Institute of Innovative Technologies EMAG
Bibliografia
  • 1. Abberley D., Kirby D., Renals S., Robinson T.: The THISL broadcast news retrieval system. w Proc. ESCA Workshop on Accessing Information In Spoken Audio, Cambridge, 1999 pp., 14–19
  • 2. Liu B.: Sentiment analysis and opinion mining, Synthesis Lectures on Human Language Technologies, 2012, 5(1) pp. 1-167.
  • 3. de Campos L. M., Fernandez J. M., Huete, J. F.: Query expansion in information retrieval systems using a Bayesian network-based thesaurus, Proceedings of the Fourteenth Annual Conference on Uncertainty in Artificial Intelligence, pp. 53 – 60, San Francisco, 1998
  • 4. Chapelle O., Chang Y.: Yahoo! Learning to Rank Challenge Overview, Journal of Machine Learning Research Proceedings Track, 2011, 14 pp. 1–24
  • 5. Deveaud R., Sanjuan E., Bellot P.: Accurate and Effective Latent Concept Modeling for Ad Hoc Information Retrieval. Document Numerique, 2014, 17(1), pp. 61-84
  • 6. Dramé K., Mougin F., Diallo G.: Query Expansion using External Resources for Improving Information, Retrieval in the Bio-medical Domain, w Proceedings of the ShARe/CLEF eHealth Evaluation Lab, 2014, pp. 189-194
  • 7. Dutta S., Weikum G.: Cross-document Co-reference Resolution using Sample-based Clustering with Knowledge Enrichment,. Transactions of the Association for Computational Linguistics, 2015, 3 pp. 15-28
  • 8. Hajnicz E..: Automatyczne tworzenie semantycznych słowników walencyjnych. Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2011
  • 9. Jiang X., Tan A.-H.: Mining Ontological Knowledge from Do-main-Specific Text Documents, Proc. Of Fifth IEEE International Conference on Data Mining (ICDM 2005), pp. 665-668
  • 10. Kakde Y.: A Survey of Query Expansion until June 2012, Indian Institute of Technology, Bombay 2012.
  • 11. Luo T., Wang D., Liu R., Pan Y.: Stochastic Top-k ListNet, Proceedings of the 2015 Conference on Empirical Methods in Natu-ral Language Processing, Lisbon, 2015, pp. 676–684
  • 12. Manning C. D., Raghavan P., Schütze H.: Introduction to Information Retrieval, Cambridge University Press, NewYork, 2008
  • 13. Mykowiecka A.: Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym, Wydawnictwo PWJSTK, Warszawa, 2008
  • 14. Obrębska A.: Algorytmy słowotwórczego parafrazowania, Primum Verbum, Łódź 2014
  • 15. Ounis L., Amati G., Plachouras V., He B., Macdonald C., Johnson D.: Terrier Information Retrieval Platform. Lecture Notes in Computer Science, 2005, 3408, 517-519
  • 16. Salton G., Wong A., Yang C. S.: A vector space model for automatic indexing, Communications of the ACM, 1975, 18(11) pp. 613-620
  • 17. Sardianos C., Katakis I., Petasis G., Karkaletsis V.: Argument Ex-traction from News, Proceedings of the 2nd Workshop on Argumentation Mining, Denver, 2015, pp. 56–66
  • 18. Shinde P., Joshi P.: Survey of various query suggestion system, International Journal Of Engineering and Computer Science, 2014, 3(12), pp. 9576-9580
  • 19. Stokes N., Li Y., Cavedon L., Zobel J.: Exploring abbreviation expansion for Genomic Information Retrieval. Proceedings of the Australasian Language Technology Workshop, 2007, pp. 100-108
  • 20. Szwed P.: Enhancing Concept Extraction from Polish Texts with Rule Management, Communications in Computer and Information Science, 2016, 613 pp. 341-356
  • 21. Zheng J., Yu H.: Key Concept Identification for Medical Information Retrieval, Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 2015, pp. 579-584
Uwagi
Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-bc70fe46-20f6-4342-ac55-bfdcab68f810
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.