Analiza sentymentu
Analiza sentymentu |
---|
Polecane artykuły |
Analiza sentymentu – metoda analizy tekstu. Jej zadaniem jest wyszukać i zaklasyfikować w wypowiedzi słowa naznaczone emocjonalnie: zarówno takie, które świadczą o stanie emocjonalnym autora jak i te, które mogą wskazywać na efekt emocjonalny, jaki wypowiedź uzyska u odbiorcy (K.Tomanek, 2014, str. 120).
Może być wykorzystywana do analizy ludzkich opinii, odczuć czy postaw na przykład wobec produktów, usług, organizacji, wydarzeń czy poszczególnych osób (Bing Liu, 2012, str. 7), co daje możliwość wykorzystywania jej w wielu obszarach, takich jak nauki społeczne, ekonomiczne, a także biznes (T.Turek, 2017, str. 286).
Techniki
Klasyfikację technik wykorzystywanych w analizie sentymentu, które przedstawili W. Medhat, A. Hassan oraz H. Korashy (2014, str. 1095), w swoim artykule przytacza też T.Turek (2017, s. 287), a wskazuje ona dwie metody – statystyczną i słownikową.
Metoda statystyczna (K.Tomanek, 2014 s. 119-120):
- oparta jest na dwóch podejściach: uczeniu z nauczycielem (supervised learning) oraz uczeniu bez nadzoru (unsupervised learning)
- charakteryzuje tekst przy pomocy danych ilościowych jak np. liczba słów, cytatów
- wykorzystywane w niej techniki to np. drzewa decyzyjne czy sieci neuronowe
- daje możliwość analizy "występowania określonych słów, składni, interpunkcji, emotikonów.” (T.Turek, 2017, s. 287)
Metoda słownikowa (K.Tomanek, 2014 s. 120):
- klasyfikuje wypowiedzi ze względu na występowanie słów i fraz kluczowych (analizy KWIC – key word in context oraz KPIC – key phrase in context)
- klasyfikuje wypowiedzi ze względu na spełnianie warunków logicznych w tekście, przy czym warunki te opatrzone są operatorami, np. jednoargumentowymi, wieloargumentowymi i kontekstowymi
- klasyfikuje wypowiedzi wykorzystując reguły leksykalne, które odnoszą się do obszarów takich jak: podobieństwa i różnice w znaczeniach, zasób słów czy gramatyka języka
Słowniki
Od 2003 roku, kiedy to prekursorzy metody analizy sentymentu zbudowali algorytm pozwalający na automatyczną klasyfikację tekstów o pozytywnym i negatywnym emocjonalnym wydźwięku, nastąpił znaczny rozwój słowników pozwalających na analizowanie wypowiedzi pod tym kątem (K.Tomanek, 2014, str. 121)
Obecnie istniejące słowniki pozwalają nie tylko na proste rozróżnienie pozytywnego od negatywnego nacechowania, ale również bardziej złożoną klasyfikację, uwzględniającą takie odczucia jak niepokój czy chwała (K.Tomanek, 2014, s. 121).
Przykładowe słowniki (T.Turek, 2017, str. 288):
- Bing Liu’s Opinion Lexicon
- SentiWordNet
- MPQA Subjectivy Lexicon
Narzędzia do analizy sentymentu są dostępne też w Internecie, przykładowo Sentiment Analysis with Python NLTK Text Classification (T.Turek, 2017, s. 288)
Dane
Przedsiębiorstwa są w posiadaniu własnych, wewnętrznych źródeł danych do analizy, takich jak dane z działów call center, zapisy z infolinii, treści zgłoszeń czy ofert, które są tajne. Istnieją jednak zewnętrzne źródła, które są ogólnodostępne, np. portale społecznościowe i serwisy opiniujące. Komentarze i opinie stanowią materiał do analizy. Wykorzystanie danych do analizy jest możliwe tylko wtedy, gdy są one zdigitalizowane. (T.Turek, 2017, str. 290)
Cel
Analiza sentymentu może być wykorzystywana w wielu obszarach, jednak najczęściej stosuje się ją do analizy opinii konsumenckich (J.Maślankowski, 2017, str. 164). Dzięki recenzjom, sugestiom lub krytyce zamieszczonej na portalach i serwisach (np. w formie komentarzy) i ich analizie, producent ma szansę tworzyć produkty bardziej dopasowane do potrzeb użytkowników, a także ulepszać sposoby dystrybucji i metody promocji (T.Turek, 2017, str. 293)
Bibliografia
- Bing Liu (2012). Sentiment Analysis and Opinion Mining
- Maślankowski J. (2017). Automatyczna analiza treści nieustrukturyzowanej jako przykład źródła informacji dla administracji publicznej, "Roczniki Kolegium Analiz Ekonomicznych", Szkoła Główna Handlowa, nr 46, str. 161
- Medhat W., Hassan A., Korashy H. (2014) Sentiment analysis algorithms and applications: A survey, "Ain Shams Engineering Journal" nr 5, str. 1093
- Tomanek K. (2014). Analiza sentymentu - metoda analizy danych jakościowych: przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych, "Przegląd Socjologii Jakościowej 10/2", s. 118
- Turek T.(2017). Możliwości wykorzystania analizy sentymentu w procesach prosumenckich, "Ekonomiczne Problemy Usług nr 1/2017 (126), t.2", str. 285
Autor: Weronika Plewniak