Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Analysis Of Indications for Selected Measures used in Assessing Data Conformity to Benfordʼs Law - the First Significant Digit Case
Języki publikacji
Abstrakty
Porównywanie empirycznych rozkładów pierwszej cyfry znaczącej, ustalonych na bazie badanych zbiorów danych, z rozkładem Benforda często sprowadza się do konstruowania rankingów tych zbiorów. W tym celu korzysta się z różnych mierników podobieństwa rozkładów, które umożliwiają ocenę stopnia podobieństwa empirycznego rozkładu pierwszej niezerowej cyfry ze wspomnianym rozkładem teoretycznym. W artykule zaprezentowano wyniki analizy wskazań trzynastu mierników podobieństwa rozkładów, opierając się na danych generowanych symulacyjnie. W przeprowadzonym badaniu posłużono się analizą korelacji. Podjęto też próbę klasyfikacji mierników podobieństwa rozkładów za pomocą metody 𝑘-średnich. Rezultaty grupowania doprowadziły do wniosku, że w badaniach empirycznych, gdy dysponujemy zbiorami danych o różnej wielkości, a celem badań jest stworzenie rankingów analizowanych zbiorów ze względu na stopień ich podobieństwa z rozkładem Benforda, wystarczy ograniczyć się do czterech tego typu mierników.(abstrakt oryginalny)
Comparing empirical distributions of the first significant digit, which are determined on the basis of the analysed data sets, to Benfordʼs distribution, often leads to the creation of rankings of the data sets. In order to do this, various measures of distributions similarity are employed, which allow to assess the level of similarity of the first non-zero significant digit empirical distribution to the aforementioned theoretical one. The paper presents the results of indications for thirteen measures of distributions similarity, using simulation data. In the study, the correlation analysis was employed. Moreover, an attempt to classify the measures of distributions similarity was made by means of the 𝒌-means method. The outcomes of clustering led to the conclusion that in the empirical research (aimed at the creation of analysed data sets rankings in terms of their level of similarity to Benfordʼs distribution), when one analyses data sets of different sizes, it is enough to use only four measures of this kind.(original abstract)
Rocznik
Tom
Strony
9-18
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Krakowie
Bibliografia
- Baryła M., 2017, Analiza rozkładu pierwszej cyfry znaczącej danych finansowych wybranych spółek z sektora mediów notowanych na GPW w Warszawie, [w:] Jajuga K., Walesiak M. (red.), Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 29, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 469, s. 11-20.
- Benford F., 1938, The Law of Anomalous Numbers, Proceedings of the American Philosophical Society, vol. 78, no. 4, s. 551-572.
- Farbaniec M ., Grabiński T., Zabłocki B., Zając W., 2 012, Metody oceny zgodności rozkładów cyfr znaczących z prawami Benforda, [w:] Chmielowski W.Z., Wilk-Kołodziejczyk D. (red.), Metody analizy i oceny bezpieczeństwa oraz jakości informacji, Krakowskie Towarzystwo Edukacyjne sp. z o.o. Oficyna Wydawnicza AFM, Kraków, s. 143-178.
- Grabiński T., Sokołowski A., 1984, Z badań nad efektywnością wybranych procedur taksonomicznych, Zeszyty Naukowe Akademii Ekonomicznej w Krakowie, nr 181, s. 63-80.
- Hartigan J.A., 1975, Clustering Algorithms, John Wiley & Sons, New York.
- Judge G., Schechter L., 2009, Detecting Problems in Survey Data Using Benfordʼs Law, The Journal of Human Resources, vol. 44, no. 1, s. 1-24.
- Kukuła K., 2000, Metoda unitaryzacji zerowanej, Wydawnictwo Naukowe PWN, Warszawa.
- Morzy M., Kajdanowicz T., Szymański B.K., 2016, Benfordʼs Distribution in Complex Networks, Scientific Reports, 6:34917, DOI: 10.1038/srep34917.
- Nigrini M.J., Mittermaier L.J., 1997, The Use of Benfordʼs Law as an Aid in Analytical Procedures, Auditing: A Journal of Practice & Theory, vol. 16, no. 2, s. 52-67.
- Rauch B., Göttsche M., Brähler G., Engel S., 2011, Fact and Fiction in EU-Governmental Economic Data, German Economic Review, vol. 12, issue 3, s. 243-255.
- Slijepčević S., Blašković B., 2014, Statistical detection of fraud in the reporting of Croatian public companies, Financial Theory and Practice, vol. 38, no. 1, s. 81-96.
- Sokołowski A., 1992, Empiryczne testy istotności w taksonomii, Zeszyty Naukowe, Seria specjalna: Monografie, nr 108, Akademia Ekonomiczna w Krakowie, Kraków.
- Ward J.H., 1963, Hierarchical Grouping to Optimize an Objective Function, Journal of the American Statistical Association, vol. 58, issue 301, s. 236-244.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171524829