Zastosowanie rozszerzenia DMX do zgłębiania danych na platformie Microsoft SQL Server

Maszorek, A.; Pelikant, A.

Artykuł - szczegóły

Tytuł artykułu

Zastosowanie rozszerzenia DMX do zgłębiania danych na platformie Microsoft SQL Server

Autorzy

Maszorek A. , Pelikant A.

Identyfikatory

Warianty tytułu

Implementation of DMX extension for data mining on MS SQL Server platform

Języki publikacji

Abstrakty

Praca zawiera opis technologii zgłębiania danych oraz języka DMX (Data Mining Extension) przeznaczonego do analizy eksploracyjnej w środowisku MS SQL Server, a także wizualnej alternatywy w postaci narzędzia Microsoft Visual Studio. Dodatkowo omówione zostały algorytmy zgłębiania danych zaimplementowane przez Microsoft, przy szczególnym uwzględnieniu algorytmu Microsoft Sequence Clustering. Głównym celem pracy oprócz charakterystyki metod zgłębiania danych jest zbudowanie aplikacji windowsowej umożliwiającej tworzenie, trenowanie oraz ocenę dokładności modeli eksploracyjnych przy pomocy wspomnianego rozszerzenia DMX. Aplikacja napisana została w technologii .NET w języku C# i do trenowania modeli wykorzystuje dwa algorytmy: Microsoft Clustering oraz Microsoft Sequence Clusterin, zachowując przy tym maksimum uniwersalności konfiguracji obu tych procesów. Warto dodać również, że do komunikacji pomiędzy aplikacją a serwerem analitycznym Microsoft Analysis Services wykorzystana została biblioteka ADOMD.NET.

The paper describes methods and algorithms of data mining at the MS Analysis Services platform. At beginning the main idea of such process was presented. All steps from the relational schema through integration, schema construction till reporting was discuss. In the next step all implemented in presented tool models was presented with special attention to its mathematical principles. The main care was pointed to Microsoft Sequence Clustering, as a main subject of this work. The DMX SQL extension was presented as the most important tool to build, process and test mining structures and models. This language was used in the client application, which was created by C# .NET. It gives opportunity to create data mining clustering models for any tables from chosen relational schema. The main original part of this work is the tool to testify Microsoft Sequence Clustering model, which is not presented in Analysis Services toolkit. The ADOMD library was used to the communication between server engine and client application, and was shortly described.

Słowa kluczowe

DMX Data Mining Extension MS SQL Server Microsoft Visual Studio algorytmy zgłębiania danych analiza eksploracyjna Microsoft Sequence Clustering Microsoft Clustering język C# Microsoft Analysis Services ADOMD.NET

Wydawca

Wyższa Szkoła Informatyki i Umiejętności

Czasopismo

Zeszyty Naukowe Wyższej Szkoły Informatyki

Rocznik

2009

Tom

Vol. 8, Nr 2

Strony

62--94

Opis fizyczny

Bibliogr. 8 poz., rys.

Twórcy

autor

Maszorek A.

autor

Pelikant A.

Wydział Informatyki Wyższej Szkoły Informatyki w Łodzi

Bibliografia

[1] A. J. Brust, S. Forte, Programowanie Microsoft SQL Server 2005 /Microsoft Press, 2006
[2] P. Cichosz, Systemu uczące Się / WNT, 2007
[3] D. Hand, H. Mannila, P.Smyth, Metody i modele eksploracji danych / WNT, 2005
[4] R. Jacobson, S. Misner, H. Consulting, SQL Server 2005 Analysis Services, Microsoft Press, 2006
[5] D. T. Larose, Metody i modele eksploracji danych / PWN, 2008
[6] D. T. Larose, Odkrywanie wiedzy z danych / PWN, 2006
[7] Z. Tang, J. MacLennan, Data Mining with SQL Server 2005 / Wiley, 2005
[8] SQL Server 2005 Books Online – Data Mining Algorithms, http://msdn.microsoft.com/en-us/library/ms175595(SQL.90).aspx

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BUJ5-0050-0086