Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
Wyzwaniem jakie niesie w sobie efekt powszechnej dostępności danych staje się problem twórczego ich przetworzenia, pozwalającego na uzyskanie użytecznej wiedzy na podstawie wnikliwej analizy informacji źródłowej. Prawidłowość ta powszechna w czasach rozwoju sieci globalnej, dotyczy także danych o charakterze przestrzennym, w tym szczególnie interesujących, danych o charakterze statystycznym. Celem autorów opracowania było zastosowanie zaawansowanych technik cyfrowego "drążenia danych przestrzennych" (ang. spatial data mining) zgromadzonych przez ankieterów GUS w ramach realizacji dwóch spisów powszechnych: Państwowego Spisu Rolnego (PSR) i Narodowego Spisu Powszechnego (NSP) oraz ich "wzbogacenia" (ang. data enrichment). Wykorzystanie tego podejścia, będącego współczesnym odpowiednikiem kartograficznej metody badań, pozwala nie tylko na "odkrycie" wzorców i prawidłowości przestrzennych, ale przede wszystkim na "ujawnienie" wiedzy zawartej w bazie danych i nadanie jej postaci explicite. Biorąc pod uwagę zakres oraz szczegółowość (najniższym udostępnianym przez GUS poziomem agregacji są gminy) danych pozyskanych w ramach obu spisów można spodziewać się występowania wielu zależności zachodzących między danymi – zarówno intuicyjnych, wymagających jedynie statystycznego potwierdzenia oraz kartograficznej wizualizacji, jak i bardziej złożonych i niejako "ukrytych" w danych. Identyfikacja, analiza i wizualizacja tych zależności pozwolą na uzyskanie dodatkowej wiedzy, która może być wykorzystana do realizacji rozwoju polityki przestrzennego zagospodarowania kraju. Autorzy przedstawili propozycje zarówno analiz statystycznych, jak również kartograficznej prezentacji wyników tych analiz, które mogą być przydatne w realizacji celów, jakie stawia sobie geoportal statystyczny. W artykule opisano dwa przykłady takich analiz. Pierwsza z nich bazuje na wykorzystaniu analizy regresji wielorakiej z uwzględnieniem relacji sąsiedztwa. W wyniku tej analizy zbudowany został model opisujący zależności pomiędzy zmiennymi rejestrowanymi w jednostkach podziału administracyjnego kraju. Drugim przykładem opisanym w artykule jest analiza skupień realizowana za pomocą algorytmu k-średnich. Metoda ta została wykorzystana do klasyfikacji statystycznych powiatów, pozwalającej na wyodrębnienie grup homogenicznych pod względem wieloczynnikowego podobieństwa wyznaczanego w niemetrycznej przestrzeni cech.
EN
In the face of ubiquitous data availability, it becomes a challenge to process data in such a way that allows to gain useful knowledge based on the analysis of source information. The aim of the authors was to discuss the use of advanced spatial data mining techniques to data collected by the Central Statistical Office interviewers in two censuses: Agricultural Census and National Census of Population and Housing and of data enrichment. Using this approach, which is a modern equivalent of the cartographic research method, allows not only to discover spatial patterns and regularities, but above all to reveal some knowledge contained in the database. Taking into account the scope and level of detail (the lowest available level of aggregation by the Central Statistical Office are communes) in the data obtained in the two censuses a number of relationships between data may be expected – both intuitive, requiring only statistical confirmation and cartographic visualization, as well as more complex and "hidden" in the data. Identification, analysis and visualization of these dependencies will allow to gain additional knowledge that can be used to develop national spatial planning policy. The authors presented proposals of either statistical analyses or cartographic presentation of the results of analyses, which may be useful in achieving objectives set by the statistical geoportal. The article describes two examples of such analyses. The first one is based on multiple regression analysis taking into account the neighborhood relationships. The model describing the relationships between variables gathered for the administrative units was constructed in the result of the analysis. The second example described in the article is a cluster analysis performed by the k-means algorithm. This method was used for statistical classification of administrative units allowing to extract homogeneous groups with regard to multi-factor similarity determined in a non-metric feature space.
EN
The wide access to source data, published by numerous websites, results in situation, when information acquisition is not a problem any more. The real problem is how to transform information in the useful knowledge. Cartographic method of research, dealing with spatial data, has been serving this purpose for many years. Nowadays, it allows conducting analyses at the high complexity level, thanks to the intense development in IT technologies, The vast majority of analytic methods utilizing the so-called data mining and data enrichment techniques, however, concerns non-spatial data. According to the Authors, utilizing those techniques in spatial data analysis (including analysis based on statistical data with spatial reference), would allow the evolution of the Spatial Information Infrastructure. (SII) into the Spatial Knowledge Infrastructure (SKI). The SKI development would benefit from the existence of statistical geoportal. Its proposed functionality, consisting of data analysis as well as visualization, is outlined in the article. The examples of geostatistical analyses (ANOVA and the regression model considering the spatial neighborhood), possible to implement in such portal and allowing to produce the “cartographic added value”, are also presented here.
PL
Szeroki dostęp do danych źródłowych publikowanych w licznych serwisach internetowych sprawia, iż współcześnie problemem jest nie pozyskanie informacji, lecz umiejętne przekształcenie jej w użyteczną wiedze. Kartograficzna metoda badan, która od wielu lat służy temu celowi w odniesieniu do danych przestrzennych, zyskuje dziś nowe oblicze - pozwala na wykonywanie złożonych analiz dzięki wykorzystaniu intensywnego rozwoju technologii informatycznych. Znacząca większość zastosowań metod analitycznych tzw. eksploracyjnej analizy danych (data mining) i ich „wzbogacania” (data enrichment) dotyczy jednakże danych nieprzestrzennych. Wykorzystanie tych metod do analizy danych o charakterze przestrzennym, w tym danych statystycznych, i zapewnienie dostępu do nich w formie dedykowanych usług przyczyniłoby się, zdaniem Autorów, do przetworzenia infrastruktury informacji przestrzennej (Spatial Information Infrastructure - SII) w infrastrukturę wiedzy przestrzennej (Spatial Knowledge Infrastructure - SKI). Rozwojowi SKI mógłby służyć geoportal statystyczny, którego propozycje funkcjonalności, obejmujące zarówno analizę jak i wizualizacje danych, zarysowano w artykule. Zaprezentowano tez przykłady analiz statystycznych (ANOVA, regresja z uwzględnieniem sąsiedztwa przestrzennego), możliwych do zaimplementowania w takim portalu, a które mogłyby się przyczynić do wytworzenia „kartograficznej wartości dodanej”.
PL
Dotychczas zrealizowano trzy edycje programu CORINE Land Cover. Wynikiem pierwszego programu (CLC-90) było opracowanie bazy danych o pokryciu terenu w 1990 r. Celem kolejnego projektu (CLC-2000) było sporządzenie zaktualizowanej bazy danych o pokryciu terenu w 2000 r. oraz bazy danych o zmianach pokrycia terenu w latach 1990-2000. W ramach ostatniego programu CLC-2006, została opracowana baza danych o pokrycia terenu w 2006 r. oraz baza danych zmian pokrycia terenu w latach 2000-2006. Przyjęta metodyka tworzenia bazy CLC-2006 obejmowała integrację danych CLC-2000 i danych CLC-Change, tylko z uwzględnieniem zmian o powierzchni co najmniej 25 ha oraz włączenie małych poligonów do którejś z otaczających form pokrycia terenu. Przyjęcie takiego założenia metodycznego przy tworzeniu bazy o pokryciu terenu w 2006 r. rodzi pytanie, na ile może ono wpływać na szczegółowość wydzieleń zawartych w tej bazie danych. Do sprawdzenia wpływu, jaki wywiera wybór metody generowania bazy danych CLC-2006 na szczegółowość danych o pokryciu terenu, wybrano Obszar Metropolitalny Warszawy. Zgodnie z przyjętymi założeniami metodycznymi (integracja zmian o powierzchni większej niż 5 ha), połączono bazy danych CLC-2000 i bazy danych CLC-Change. W wyniku przeprowadzonej procedury, wygenerowano nową bazę danych o pokryciu terenu poziomu 3 (CLC-2006A). Kolejnym krokiem analiz, było opracowanie szczegółowego zestawienia statystycznego, obejmującego porównanie baz danych CLC-2006 i CLC-2006A. Przeprowadzone analizy wykazały, że przyjęte odmienne poziomy szczegółowości wyznaczania form pokrycia, dają w konsekwencji różne poziomy uogólnienia treści, zarówno pod względem liczby wydzieleń jak i powierzchni poszczególnych form pokrycia terenu. W bazie CLC-2006A, w porównaniu z bazą danych CLC-2006, zwiększyła się liczba zarejestrowanych poligonów. Ich liczba wzrosła z 4340 do 4495, z czego 135 to wydzielenia, których powierzchnia mieści się w przedziale 5-25 ha, a które nie były uwzględnione w bazie CLC-2006. Nastąpił także wielokierunkowy proces zmian powierzchni poszczególnych wydzieleń. Obserwujemy wzrost powierzchni niektórych form pokrycia terenu: terenów przemysłowych lub handlowych (121), miejsc eksploatacji odkrywkowej (131), budów (133), terenów rolniczych z dużym udziałem roślinności naturalnej (243) oraz lasów w stanie zmian (324). Wyniki analiz wskazują na zasadność reinterpretacji bazy CLC-2006, co może w dużym stopniu przyczynić się do poprawy szczegółowości prowadzonych analiz, zwłaszcza przy ocenie powierzchni form pokrycia terenu oraz w analizach wskaźnikowych, np. przy określaniu wskaźników urbanizacji, lesistości lub antropizacji.
EN
Three editions of CORINE Land Cover have been carried out so far. The first program (CLC-90) resulted in the elaboration of a database of land cover in 1990. The aim of the next project (CLC-2000) was to create an up-to-date database of land cover in the year 2000 and a database of changes in land cover in 1990-2000. Finally, the result of the last CLC-2006 program, was the elaboration of a database of land cover in 2006 and a database of changes in land cover in the years 2000-2006. The adopted methodology of creating CLC - 2006 base comprised integration of data of CLC-2000 and CLC-Change, taking into account only changes in areas of at least 25 hectares and the inclusion of small polygons into one of the surrounding forms of land cover. The adoption of such a methodological assumption in the creation of the 2006 land cover basis breeds the question how it can influence the level of detail of divisions contained in this database. Warsaw Metropolitan Area has been chosen to verify the influence of the choice of method of generating the CLC-2006 data base on the level of detail of land cover data. CLC-2000 and CLC-Change databases were merged according to the adopted methodology (integration of changes of over 5-hectare areas). The effect of the procedure was the generation of a new database of land cover level 3 (CLC-2006A). The next step of the analyses was the elaboration of a detailed statistical analysis comprising the comparison of databases CLC-2006 and CLC-2006A. The conducted analyses have shown that adopted different levels of detail in designating cover forms result in different levels of content generalization, both in number of divisions and in areas of particular land cover forms. In the CLC-2006A base the number of registered polygons is larger than in the CLC-2006 base. Their number has risen from 4340 to 4495, out of which 135 are between 5 and 25 hectares and which were not included in CLC-2006 base. A multi-directional process of changes within the areas of particular divisions has also taken place. Some land cover forms have grown in size: industrial or commercial territories (121), locations of open pit mines (131), building sites (133), farming territories with a large share of natural vegetation (243) and forests in the state of change (324). The results of the analyses indicate the validity of reinterpreting basis CLC-2006, which can largely improve level of detail of conducted analyses, especially in evaluating areas of land cover forms and in index analyses, e.g. in the determination of urbanization, forest area and population distribution indexes.
4
PL
Odpowiedni dobór środków graficznych w zasadniczy sposób wpływa na percepcję oraz właściwe zrozumienie treści opracowania kartograficznego. W ubiegłym roku, w ramach budowy spójnej europejskiej infrastruktury informacji przestrzennej INSPIRE, opracowane zostały ostateczne wersje specyfikacji danych z pierwszej grupy tematycznej. Specyfikacje te zawierają m.in. wytyczne dotyczące zasad obrazowania dla poszczególnych klas obiektów przestrzennych. Analizując te wytyczne, można zauważyć istotne różnice pomiędzy nimi, a zasadami przyjętymi w serwisie geoportal.gov.pl, odzwierciedlającymi sposób prezentacji kartograficznej, do której przyzwyczajony jest polski użytkownik map bądź serwisów mapowych. Większość tych różnic ma charakter zaledwie niuansowy, jednakże istnieją również różnice znaczące, które skutkować mogą co najmniej niezrozumieniem, a czasem wręcz błędną interpretacją zawartej w opracowaniu treści geograficznej przez użytkownika przyzwyczajonego do polskich standardów. Na rysunku 1 przedstawiono mapę zawierającą treść z pogranicza Polski i Niemiec, przy czym zastosowano odmienne zasady prezentacji kartograficznej po obu stronach granicy. Pokazuje to, jak może różnić się przedstawienie podobnej treści przy zastosowaniu innych zasad obrazowania. W artykule przedstawiono wyniki analizy tych różnic dla następujących tematów z pierwszej grupy INSPIRE: jednostki administracyjne, sieci transportowe, obszary chronione oraz hydrografia.
EN
An appropriate selection of the graphical means has great influence on perception and understanding of a cartographic product content. Last year, under creating of the common, coherent, European Spatial Information Infrastructure INSPIRE, the final versions of data specifications for the first thematic group (Annex I) were developed. Those specifications contain inter alia guidelines connected with portrayal rules for the feature classes. Analyses of these guidelines show some differences were between INSPIRE portrayal rules and rules and standards for Polish cartographic products (including geoportals and other web map services). Most of these differences are not so important, but there are some, which may cause lack of understanding or even incorrect interpretation of the map content by the Polish user. In the paper, an analysis of differences in INSPIRE portrayal are presented for the following INSPIRE themes: administrative units, transport networks, hydrography and protected sites, with portrayal of corresponding feature types in geoportal.gov.pl service.
5
Content available remote Analytical tools for business intelligence in spatial databases
EN
The term Business Intelligence (BI) stands for technologies and applications that support decision making in commercial business. It is based on data analysis in a specific kind of database, termed the data warehouse. The architecture of data warehouses is optimized for searching, analysing and reporting of data. Nowadays, some spatial databases, especially in the commercial area, are so large and complex that simple analysis and reporting are not able to show all relationships and connections between data. The article focuses on two BI tools: On-line Analytical Processing (OLAP) and data mining, and on the potential for using these tools in spatial databases. OLAP allows the creation of multidimensional views of data reports in the form of multidimensional cubes. In the spatial database, such views can be useful to show complex reports, including information about spatial location, time and other dimensions. Data mining is based on analytical searching of some regular relationship and pattern in databases, which are hidden and not visible while using simple analysis. The aim of data mining for spatial databases, can be to predict the influence of a geographic object on (a) neighbour object(s), including their attributes.
PL
Termin Business Intelligence (BI) oznacza technologie i aplikacje, które wspomagają podejmowanie decyzji w sferze biznesowej. Opiera się na analizie danych w specyficznym rodzaju baz danych, które określane są mianem hurtowni danych. Architektura hurtowni danych zoptymalizowana jest pod kątem przeszukiwania, analizy i raportowania zawartych w niej danych. Obecnie niektóre bazy danych przestrzennych, zwłaszcza w zastosowaniu komercyjnym, są tak obszerne i złożone, że prosta analiza i raportowanie nie są w stanie pokazać wszystkich związków pomiędzy danymi. Niniejszy artykuł skupia się na dwóch narzędziach BI: przetwarzaniem analitycznym on-line (OLAP, ang. On-line Analytical Processing) i eksploracją danych (ang. data mining) oraz możliwościami zastosowania tych narzędzi w bazach danych przestrzennych. OLAP pozawala na tworzenie wielowymiarowych widoków raportowych w formie wielowymiarowych kostek. W bazie danych przestrzennych widoki takie mogą być użyteczne do pokazania złożonego raportu, zawierającego informację o położeniu przestrzennym, czasie, czy dowolnym innym wymiarze. Eksploracja danych jest techniką opartą na analitycznym wyszukiwaniu w bazach danych stałych związków i wzorów, które są ukryte i niewidoczne podczas stosowania prostych analiz. Celem eksploracji danych w przypadku baz danych przestrzennych może być przewidywanie wpływu obiektu geograficznego na obiekt(y) sąsiedni, przy uwzględnieniu jego atrybutów.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.