Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  ETL process
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
Maintaining data warehouses and ETL processes is becoming increasingly difficult. For this reason, we introduce a similarity measure on ETL processes, based on the edit distance of a graph, which models the process. We show both the exact way how to calculate it and heuristic approaches to compute the estimated similarity more quickly. We propose methods to improve graph edit distance based on the assumption that the ETL process model is a directed acyclic graph.
2
Content available remote Data Warehouses - Models, Techniques and Applications
EN
This paper discusses the basic concepts of modern data warehouses. It presents the multidimensional data model (logical model) and the physical model of a data warehouse, as well as selected design and implementation issues. The focus is on the practical aspects of the application of data warehousing in business enterprises and organizations.
PL
Stale wzrastające zastosowanie baz danych przestrzennych we współczesnych systemach informacyjnych wiąże się z przetwarzaniem dużej ilości danych. Problemem jest także mnogość formatów takich danych. W takim kontekście warto zwrócić uwagę na hurtownie danych dedykowane danym przestrzennym. Niniejszy artykuł opisuje przykładowy problem łączenia i przetwarzania danych, które mogą pochodzić z różnych źródeł. Jako środowiska wybrano wolnodostępne rozwiązania Talend Open Studio i GeoKettle.
EN
Steadily increasing use of spatial databases in modern information systems is associated with processing large amounts of data. Another problem is the multitude of formats for such kind of data. In this context it is worthwhile to draw attention to a dedicated data warehouse domain. This article describes an example of the problem of combining and processing data from different sources. Talend Open Studio and GeoKettle are selected as public domain solutions.
4
Content available remote Research Problems of the ETL Technology
EN
This paper overviews research developments in the field of the ETL technology with respect to the four following research fields: modeling of ETL processes, data cleaning, optimization of ETL processes, and evolution of ETL processes. In each of these research fields we outlined the most influential solutions and illustrated them with examples. This paper we also overviews a project that is currently being realized in the Institute of Computing Science at the Poznań University of Technology. The project focuses on developing a method and a framework for the support of the evolution of ETL process.
PL
Równoważenie obciążenia systemów równoległych zapewnia minimalny czas realizacji zadań wysłanych do przetworzenia. W niniejszym artykule przedstawiono algorytm balansowania obciążeniem rozproszonej telemetrycznej hurtowni danych. Balansowanie jest wykonywane poprzez dobór rozmiaru zbioru danych ładowanych w każdym z węzłów.
EN
Balancing of parallel systems workload is very essential to ensure minimal response time of jobs submitted to process. In this paper an workload balancing algorithm of spatial telemetrie data warehouse is presented. Balancing is performed by selection of data set size loaded into each node.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.