PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Zastosowanie rozszerzenia DMX do zgłębiania danych na platformie Microsoft SQL Server

Identyfikatory
Warianty tytułu
EN
Implementation of DMX extension for data mining on MS SQL Server platform
Języki publikacji
PL
Abstrakty
PL
Praca zawiera opis technologii zgłębiania danych oraz języka DMX (Data Mining Extension) przeznaczonego do analizy eksploracyjnej w środowisku MS SQL Server, a także wizualnej alternatywy w postaci narzędzia Microsoft Visual Studio. Dodatkowo omówione zostały algorytmy zgłębiania danych zaimplementowane przez Microsoft, przy szczególnym uwzględnieniu algorytmu Microsoft Sequence Clustering. Głównym celem pracy oprócz charakterystyki metod zgłębiania danych jest zbudowanie aplikacji windowsowej umożliwiającej tworzenie, trenowanie oraz ocenę dokładności modeli eksploracyjnych przy pomocy wspomnianego rozszerzenia DMX. Aplikacja napisana została w technologii .NET w języku C# i do trenowania modeli wykorzystuje dwa algorytmy: Microsoft Clustering oraz Microsoft Sequence Clusterin, zachowując przy tym maksimum uniwersalności konfiguracji obu tych procesów. Warto dodać również, że do komunikacji pomiędzy aplikacją a serwerem analitycznym Microsoft Analysis Services wykorzystana została biblioteka ADOMD.NET.
EN
The paper describes methods and algorithms of data mining at the MS Analysis Services platform. At beginning the main idea of such process was presented. All steps from the relational schema through integration, schema construction till reporting was discuss. In the next step all implemented in presented tool models was presented with special attention to its mathematical principles. The main care was pointed to Microsoft Sequence Clustering, as a main subject of this work. The DMX SQL extension was presented as the most important tool to build, process and test mining structures and models. This language was used in the client application, which was created by C# .NET. It gives opportunity to create data mining clustering models for any tables from chosen relational schema. The main original part of this work is the tool to testify Microsoft Sequence Clustering model, which is not presented in Analysis Services toolkit. The ADOMD library was used to the communication between server engine and client application, and was shortly described.
Rocznik
Strony
62--94
Opis fizyczny
Bibliogr. 8 poz., rys.
Twórcy
autor
autor
  • Wydział Informatyki Wyższej Szkoły Informatyki w Łodzi
Bibliografia
  • [1] A. J. Brust, S. Forte, Programowanie Microsoft SQL Server 2005 /Microsoft Press, 2006
  • [2] P. Cichosz, Systemu uczące Się / WNT, 2007
  • [3] D. Hand, H. Mannila, P.Smyth, Metody i modele eksploracji danych / WNT, 2005
  • [4] R. Jacobson, S. Misner, H. Consulting, SQL Server 2005 Analysis Services, Microsoft Press, 2006
  • [5] D. T. Larose, Metody i modele eksploracji danych / PWN, 2008
  • [6] D. T. Larose, Odkrywanie wiedzy z danych / PWN, 2006
  • [7] Z. Tang, J. MacLennan, Data Mining with SQL Server 2005 / Wiley, 2005
  • [8] SQL Server 2005 Books Online – Data Mining Algorithms, http://msdn.microsoft.com/en-us/library/ms175595(SQL.90).aspx
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BUJ5-0050-0086
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.