Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Big Data = Clear + Dirty + Dark Data
Języki publikacji
Abstrakty
Rozwój techniki teleinformacyjnej, Internetu i informatyki przy jednoczesnym spadku jednostkowych kosztów gromadzenia i przechowywania danych powoduje istotne ilościowe i jakościowe zmiany w podejściu zarówno do samych danych, jak i możliwości ich analizy. Ten coraz bardziej gęsty, ciągły i niestrukturyzowany strumień danych, nazywany Big Data, wywołuje współcześnie wiele emocji. Z jednej strony brak odpowiedniej ilości danych był zawsze wyzwaniem dla metod wnioskowania statystycznego i jednym z bodźców ich rozwoju. Jednak z drugiej strony, w dużych liczebnościach prób zawarte są liczne zagrożenia dla wiarygodności wnioskowania. W zbiorach takich, poza danymi o odpowiedniej jakości (Clear Data), znaczny udział mają dane nieprawdziwe, nieaktualne, zaszumione, często wielokrotnie zduplikowane, niekompletne lub błędne (Dirty Data), a także dane, o których jakości czy użyteczności nic nie wiadomo (Dark Data). Celem prezentowanych badań jest krytyczne przedstawienie struktury jakościowej zbioru Big Data(abstrakt oryginalny)
The development of technology data communications, the Internet and computer with the simultaneous decrease the unit costs of data collection and storage results in significant quantitative and qualitative changes in the approach to the same data, and the possibility of their analysis. The increasingly dense, continuous and unstructured data stream, called Big Data, evokes a lot of emotion today. On the one hand, the lack of adequate quantities of data has always been a challenge for the methods of statistical inference and one of the stimuli of their development. On the other hand, the large sets included threats to the reliability of the inference. In such collections, in addition to data of sufficient quality (Clear Data), the data which are inaccurate, outdated, noisy, often repeatedly duplicate, incomplete or erroneous (Dirty Data), as well as data about which quality or usability nothing is known (Dark Date) have a significante share. The aim of this study is to present the structure of the critical qualitative set of Big Data(original abstract)
Rocznik
Tom
Strony
131-139
Opis fizyczny
Twórcy
Bibliografia
- Dokumenty Metodologiczne 4.2, Eurostat, Luksemburg, 2-3 października 2003.
- http://info.networkedinsights.com/Dirty-Data-LP.html (4.11.2016).
- http://www.bbc.com/news/science-environment-31450389 (4.11.2016).
- http://www.gartner.com/it-glossary/(4.11.2016).
- http://www.go-globe.com/ (4.11.2016).
- http://www.pcworld.com.mx/Articulos/30148.htm (4.11.2016).
- http://www.reachforce.com/blog/6-quick-dirty-data-stats/ (20.05.2017).
- http://www.slashgear.com/a-digital-dark-age-is-coming-warns-father-of-the-internet-13368963/ (4.11.2016).
- http://www.tcs.com/big-data-study/Pages/download-report.aspx (4.11.2016).
- Networked Insights, 2012, Big Data, Can Mean Big Insights, Social Intelligence Report.
- Networked Insights, 2015, How Ditry is Big Data?
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171475951