Czasopismo
Tytuł artykułu
Autorzy
Wybrane pełne teksty z tego czasopisma
Warianty tytułu
Searching for duplicate bibliographic records in a database: the case of the Jagiellonian University Repository
Języki publikacji
Abstrakty
Thesis/Objective – The article is to describe the algorithm applied to search for duplicate bibliographic records in a bibliographic database. The algorithm in question was built to automate the query used to retrieve duplicate bibliographic records in the Jagiellonian University Repository. Research methods – In order to build the algorithm the author analyzed already existing algorithms used to compare text data. The construction of the new algorithm was done with vector calculations in multidimensional hiperspaces and analytic geometry in Cartesian plane. Results and conclusions – Tests have shown that processing of large number of records is possible and more effective if text data are replaced with numbers.
Teza/cel artykułu – Celem artykułu było opisanie działania i zastosowania algorytmu do wyszukiwania podobnych opisów bibliograficznych w różnych rekordach w bibliograficznej bazie danych. Algorytm stworzono z zamiarem zautomatyzowania kwerendy mającej na celu wskazanie potencjalnie powielonych opisów bibliograficznych w Repozytorium Uniwersytetu Jagiellońskiego. Metody badawcze – Tworząc stosowne narzędzie przeanalizowano istniejące algorytmy do porównań danych tekstowych. Przy tworzeniu nowego algorytmu wykorzystano obliczenia wektorowe w wielowymiarowych hiperprzestrzeniach i geometrię analityczną na płaszczyźnie kartezjańskiej. Wyniki i wnioski – W trakcie testów wykazano, że przetworzenie dużej liczby rekordów jest możliwe i skuteczniejsze po uprzedniej zamianie wartości danych tekstowych na liczby.
Czasopismo
Rocznik
Tom
Numer
Strony
65-79
Opis fizyczny
Twórcy
autor
- The Jagiellonian University Repository, adriandrabik@gmail.com
Bibliografia
- Chang, Chengguo; Wang, Hui (2012). Comparison of Two-Dimensional String Matching Algorithms, In: IET International Conference on Computer Science and Electronics Engineering 2012. Piscataway: Institution of Engineering and Technology, pp. 608-611.
- Charras, Christian (2004). Handbook of Exact String Matching Algorithms. London: King’s College.
- Drabik, Adrian; Sanetra, Krystyna; Szafrański, Leszek (2014). Instrukcja katalogowania dokumentów w Bibliografii Publikacji Pracowników Uniwersytetu Jagiellońskiego: opis bibliograficzny i schemat metadanych. Kraków: Biblioteka Jagiellońska.
- Krusche, Peter; Tiskin, Alexander (2010). New Algorithms for Efficient Parallel String Comparison. In: Proceedings of the 22nd ACM symposium on Parallelism in algorithms and architectures – SPAA ’10. New York: ACM Press, p. 209.
- Levenshtein, Vladimir Iosifovich (1966). Binary Codes Capable of Correcting Deletions, Insertions and Reversals. Soviet Physics = Doklady, vol. 10, no. 8, pp. 707-710.
- Ritt, Marcus et al. (2009). An integer linear programming approach for approximate string comparison. "European Journal of Operational Research", vol. 198, no. 3, pp. 706-714.
- SaiKrishna, Vidya; Rasool, Akhtar; Khare, Nilay (2012). String Matching and its Applications in Diversified Fields. "International Journal of Computer Science Issues", vol. 9, no. 1, pp. 219-226.
- Tiskin, Alexander (2008). Semi-local String Comparison: Algorithmic Techniques and Applications. "Mathematics in Computer Science", vol. 1, no. 4, pp. 571-603.
- Zhenhong, Lv et al. (2012). Fast Single Pattern String Matching Algorithms Based on Multi-Windows and Integer Comparison. In: IET International Conference on Information Science and Control Engineering 2012. Piscataway: Institution of Engineering and Technology, pp. 1-5.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.desklight-094c8952-8bac-4154-a463-ec4c75109083