Analiza sentymentu

Analiza sentymentu
Polecane artykuły


Analiza sentymentumetoda analizy tekstu. Jej zadaniem jest wyszukać i zaklasyfikować w wypowiedzi słowa naznaczone emocjonalnie: zarówno takie, które świadczą o stanie emocjonalnym autora jak i te, które mogą wskazywać na efekt emocjonalny, jaki wypowiedź uzyska u odbiorcy (K.Tomanek, 2014, str. 120).

Może być wykorzystywana do analizy ludzkich opinii, odczuć czy postaw na przykład wobec produktów, usług, organizacji, wydarzeń czy poszczególnych osób (Bing Liu, 2012, str. 7), co daje możliwość wykorzystywania jej w wielu obszarach, takich jak nauki społeczne, ekonomiczne, a także biznes (T.Turek, 2017, str. 286).

Techniki

Klasyfikację technik wykorzystywanych w analizie sentymentu, które przedstawili W. Medhat, A. Hassan oraz H. Korashy (2014, str. 1095), w swoim artykule przytacza też T.Turek (2017, s. 287), a wskazuje ona dwie metody – statystyczną i słownikową.

Metoda statystyczna (K.Tomanek, 2014 s. 119-120):

  • oparta jest na dwóch podejściach: uczeniu z nauczycielem (supervised learning) oraz uczeniu bez nadzoru (unsupervised learning)
  • charakteryzuje tekst przy pomocy danych ilościowych jak np. liczba słów, cytatów
  • wykorzystywane w niej techniki to np. drzewa decyzyjne czy sieci neuronowe
  • daje możliwość analizy "występowania określonych słów, składni, interpunkcji, emotikonów.” (T.Turek, 2017, s. 287)

Metoda słownikowa (K.Tomanek, 2014 s. 120):

  • klasyfikuje wypowiedzi ze względu na występowanie słów i fraz kluczowych (analizy KWIC – key word in context oraz KPIC – key phrase in context)
  • klasyfikuje wypowiedzi ze względu na spełnianie warunków logicznych w tekście, przy czym warunki te opatrzone są operatorami, np. jednoargumentowymi, wieloargumentowymi i kontekstowymi
  • klasyfikuje wypowiedzi wykorzystując reguły leksykalne, które odnoszą się do obszarów takich jak: podobieństwa i różnice w znaczeniach, zasób słów czy gramatyka języka

Słowniki

Od 2003 roku, kiedy to prekursorzy metody analizy sentymentu zbudowali algorytm pozwalający na automatyczną klasyfikację tekstów o pozytywnym i negatywnym emocjonalnym wydźwięku, nastąpił znaczny rozwój słowników pozwalających na analizowanie wypowiedzi pod tym kątem (K.Tomanek, 2014, str. 121)

Obecnie istniejące słowniki pozwalają nie tylko na proste rozróżnienie pozytywnego od negatywnego nacechowania, ale również bardziej złożoną klasyfikację, uwzględniającą takie odczucia jak niepokój czy chwała (K.Tomanek, 2014, s. 121).

Przykładowe słowniki (T.Turek, 2017, str. 288):

  • Bing Liu’s Opinion Lexicon
  • SentiWordNet
  • MPQA Subjectivy Lexicon

Narzędzia do analizy sentymentu są dostępne też w Internecie, przykładowo Sentiment Analysis with Python NLTK Text Classification (T.Turek, 2017, s. 288)

Dane

Przedsiębiorstwa są w posiadaniu własnych, wewnętrznych źródeł danych do analizy, takich jak dane z działów call center, zapisy z infolinii, treści zgłoszeń czy ofert, które są tajne. Istnieją jednak zewnętrzne źródła, które są ogólnodostępne, np. portale społecznościowe i serwisy opiniujące. Komentarze i opinie stanowią materiał do analizy. Wykorzystanie danych do analizy jest możliwe tylko wtedy, gdy są one zdigitalizowane. (T.Turek, 2017, str. 290)

Cel

Analiza sentymentu może być wykorzystywana w wielu obszarach, jednak najczęściej stosuje się ją do analizy opinii konsumenckich (J.Maślankowski, 2017, str. 164). Dzięki recenzjom, sugestiom lub krytyce zamieszczonej na portalach i serwisach (np. w formie komentarzy) i ich analizie, producent ma szansę tworzyć produkty bardziej dopasowane do potrzeb użytkowników, a także ulepszać sposoby dystrybucji i metody promocji (T.Turek, 2017, str. 293)


Bibliografia

Autor: Weronika Plewniak