Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Selection of the Optimal Set of Relevant Words in Consumers Opinions in the Context of the Opinion Mining
Języki publikacji
Abstrakty
Analiza opinii konsumenckich jest obszarem badań, który może mieć znaczą-cy wpływ na rozwój działalności biznesowej. Wiele podejść do automatycznej analizy opinii konsumenckich opartych jest na podobieństwie lub też odległości między dokumentami tek-stowymi. Powstaje więc problem, która z miar podobieństwa dokumentów tekstowych (lub ich odległości) jest najlepsza w przypadku charakterystycznego rodzaju tekstów, jakimi są opinie konsumentów. Głównym celem pracy jest przeprowadzenie analizy doboru optymal-nego zestawu słów istotnych podczas obliczania podobieństwa (odległości) dokumentów tekstowych stosowanych na potrzeby automatycznej analizy opinii konsumenckich. Do ob-liczeń wykorzystane zostały: język R, program RapidMiner oraz arkusz kalkulacyjny.(abstrakt oryginalny)
Sentiment analysis is the research area that can have a significant impact on to-day's business. A lot of sentiment analysis studies base on similarity (or distance) between opinions as special kinds of texts. The problem that must be solved is to determine the best similarity measure to deal with opinions. The main objective of this paper is to conduct the analysis of the selection of optimal set of words relevant when calculating the similarity (distance) of text documents in the context of the opinion mining. Computations are con-ducted in R language, RapidMiner application and spreadsheet.(original abstract)
Rocznik
Tom
Strony
106-115
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Krakowie
autor
- Uniwersytet Ekonomiczny w Krakowie
Bibliografia
- Abramowicz W. (2008), Filtrowanie informacji, Wydawnictwo Akademii Ekonomicznej w Poznaniu, Poznań.
- Deza M.M., Deza E. (2009), Encyclopedia of distances, Springer-Verlang, Berlin - Heidelberg.
- Goldberg D.E. (1989), Genetic Algorithms in Search, Optimization, and Machine Learning. Reading, Addison-Wesley, Massachusetts.
- Grabowski M. (2012), Naukowa legitymizacja obszaru Systemów Informacyjnych Zarządzania. Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie, Kraków.
- Liu B. (2007), Web DataMining. Exploring Hyperlinks, Contents, and Usage Data, Springer-Verlag, Berlin - Heidelberg.
- Lula P., Automatyczna analiza opinii konsumenckich, [w:] Klasyfikacja i analiza danych - teoria i zastosowania, red. K. Jajuga, M. Walesiak, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu nr 176, Taksonomia 18, Wydawnictwo Uniwersytetu Ekonomicznego, Wrocław, s. 53-62.
- Lula P., Wójcik K. (2011), Sentiment analysis of consumer opinions writen in Polish, "Economics and Management" no 16, s. 1286-1291.
- Ohana B., Tierney B. (2009), Sentiment Classification of Reviews Using SentiWordNet, IT&T Conference, Dublin Institute of Technology, Dublin.
- Pang B., Lee L. (2008), Opinion Mining and Sentiment Analysis, "Foundations and Trends in Infor-mation Retrieval" 2(1-2), s. 1-135.
- Wójcik K. (2011), Analiza porównawcza miar podobieństwa tekstów, [w:] Klasyfikacja i analiza danych - teoria i zastosowania, red. K. Jajuga, M. Walesiak, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu nr 176, Taksonomia 18, Wydawnictwo Uniwersytetu Eko-nomicznego, Wrocław, s. 340-348.
- Wikipedia. http://pl.wikipedia.org/wiki (12 października 2012).
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171283241