Systemy OLAP

Systemy OLAP
Polecane artykuły


Systemy informowania kierownictwa oparte na technikach OLAP są narzędziem pozwalającym na wielowymiarową analizę danych biznesowych zgromadzonych w hurtowni oraz na spersonalizowany dostęp do wyników analizy za pomocą wybranych mediów komunikacji.

Wykorzystanie

System wspomagania decyzji wykorzystujący OLAP powinien umożliwiać analizę danych na najniższym poziomie szczegółowości (poziom danych transakcyjnych), jak również pozwalać na różnorodne uogólnienia i podsumowania danych. Jeśli dane w bazie są wstępnie przetworzone, przeliczone i przygotowane do prezentacji, to wydajność wyszukiwania i szybkość reakcji na zapytanie użytkownika jest maksymalna. System OLAP pozwala na wielowymiarową analizę danych zainicjowaną przez końcowego użytkownika z jego stacji roboczej w trakcie pracy na komputerze, obejmuje on także możliwości manipulacji wymiarami oraz złożone mechanizmy raportowania i wizualizacji danych.

Porównanie z systemami hurtowni danych

W poniższej tablicy na kilku przykładach przedstawiono różnice pomiędzy problemami rozwiązywanymi za pomocą narzędzi OLAP oraz techniki Data mining z hurtowni danych. Tablica zawiera pytania, na które odpowiadają poszczególne kategorie systemów informatycznych.


OLAP Data mining
Jaki był odsetek danej odpowiedzi w rezultacie akcji mailingowej? Jaki jest profil osób, które z dużym prawdopodobieństwem odpowiedzą na akcję mailingową?
Jak wiele nowych produktów sprzedaliśmy naszym dotychczasowym klientom? Którzy z obecnych klientów z dużym prawdopodobieństwem kupiliby nasz nowy produkt?
Którzy klienci nie dokonywali zakupu w ubiegłym miesiącu? Którzy klienci wydają się podatni na przejście do konkurencji w ciągu najbliższych 6 miesięcy?
Kim byli najlepsi klienci w ostatnim roku? Którzy z obecnych klientów potencjalnie przyniosą firmie w przyszłości największe zyski?
Którzy klienci nie spłacili zaciągniętego kredytu? Jakie dany klient stwarza ryzyko kredytowe?
Jak wygląda sprzedaż w poszczególnych miastach w ostatnim kwartale? Jakiej sprzedaży w poszczególnych miastach można się spodziewać w przyszłym roku?
Jaki odsetek wyprodukowanych wczoraj części okazał się wadliwy? Co mogę zrobić, by zwiększyć wydajność produkcji i zredukować liczbę braków?

Źródło: (P. Gamdzyk 2001, s. 25)

Narzędzia OLAP

Narzędzia OLAP zmieniają transakcje przechowywane w relacyjnych bazach danych na tzw. widoki, czyli wielowymiarowe struktury logiczne. Następnie dane te są organizowane w postaci kostek OLAP, przechowujące dane w sposób przypominający arkusze kalkulacyjne zamiast tradycyjnej bazy danych. Kostka umożliwia oglądanie i wyświetlanie danych z różnych punktów widzenia, przynosząc więcej korzyści użytkownikowi.

OLAP może być wdrażany w technologii (M. Nycz, 2012, s. 56):

  • relacyjnej ROLAP - relation OLAP
  • wielowymiarowej MOLAP - multidimensional OLAP
  • hybrydowej HOLAP - hybrid OLAP
  • DOLAP - desktop OLAP

Podstawowe techniki analizy wielowymiarowej:

  • Drążenie danych w górę i w dół (drill-down, grill-up),
  • Przejście od danych zagregowanych do szczegółowych (drill-through),
  • Interaktywna zmiana analizowanych wymiarów (slice-and-dice).

Kostka OLAP

Kostka OLAP (OLAP cube) jest to popularna struktura danych w rozwiązaniach analitycznych, umożliwiająca użytkownikowi – analitykowi analizę danych, bazując interaktywnie na modelu wielowymiarowym. Narzędzie OLAP musi być proste w użyciu, elastyczne i efektywne. Jest to istotne szczególnie w rozwiązaniach pracujących w czasie rzeczywistym, które wymagają głębokiej wiedzy o danych, a także złożonych, rozbudowanych zapytaniach. Sesja analityczna OLAP jest złożona z tzw. ścieżki nawigacyjnej (navigation path), która prowadzi do analizowanego procesu powiązanego z faktami według przyjętych widoków danych. Ścieżka ta jest przekształcana w sekwencję zapytań, w wyniku czego otrzymujemy wielowymiarowe odpowiedzi.

Kostka OLAP składa się z trzech opisujących ją grup:

wymiarów (dimensions), miar (measures), a także poziomów (levels).

Miary oraz wymiary są wprost skorelowane z modelem wymiarowym. Natomiast wymiary dzielą się na poziomy, hierarchie i atrybuty wymiarów.

Reguły budowy kostek OLAP

Obecnie dostępnych jest wiele narzędzi wspomagających proces analityczny OLAP. E.F. Codd w 1993 roku zdefiniował dwanaście wymagań, reguł, którego zdaniem powinno spełniać każde narzędzie systemu OLAP (E.F. Codd i In., 1993).

  1. Wielowymiarowy widok koncepcyjny ( multidimensional conceptual view)
  2. Transparencja, przeźroczystość (transparency)
  3. Dostępność (accessibility)
  4. Spójne raportowanie niezależne od obciążenia (consistent reporting performance)
  5. Architektura klient-serwer (client – Server architecture)
  6. Standardowa obsługa wymiarów (generic dimensionality)
  7. Dynamiczne przetwarzanie rzadkich macierzy ( dynamic sparse matris handling)
  8. Wsparcie dla dostępu wielu użytkowników (multi – user support)
  9. Brak ograniczeń dla krzyżowych operacji pomiędzy wymiarami (unrestricted cross-dimensional operations)
  10. Intuicyjna obsługa danych (intuitive data manipulation)
  11. Elastyczne raportowanie (flexible reporting)
  12. Nieograniczone wymiary i poziomy agregowania (unlimited dimensions and aggregation levels)
Działania na kostkach OLAP

Na kostkach OLAP wykonywane są trzy rodzaje operacji. Pierwszą jest operacja agregowania, przeprowadzana zwykle na danych liczbowych. Odpowiada za zmianę zbioru wartości miar, które opisują fakty na nową, pojedynczą, zmaterializowaną np. liczbę rekordów, sumę, minimum, maksimum, medianę czy średnią. Drugą operację odwrotną do agregacji stanowi rozwijanie, co oznacza uszczegóławianie analizowanych danych, które prowadzi do uzyskania elementów składowych otrzymanych z wcześniejszych sum, median, średnich, itp. Do trzeciej grupy operacji można zaliczyć wszystkie operacje wycinania, filtrowania, ograniczania oraz obcinania kostki (D. Dymek, W. Komnata, L. Kotulski, P. Szwed, 2015, s. 48-51).

Typy kostek OLAP

MOLAP – wielowymiarowy OLAP

Narzędzia typu MOLAP stosują wyspecjalizowane struktury danych i baz danych (MDDBMS) do nawigacji, organizacji, a także analizy przechowywanych informacji. Struktury danych MOLAP wykorzystują technologię macierzy oraz techniki efektywnego przechowywania danych ograniczające wymagania wolumenowe. Systemy klasy MOLAP mogą zapewnić doskonałą wydajność, lecz tylko wtedy, gdy są wykorzystywane do danych, które są stosowane do specyficznych procesów decyzyjnych. Narzędzia MOLAP narzucają konieczność połączenia warstw aplikacji i prezentacji.

ROLAP – relacyjny OLAP

System klasy ROLAP jest najszybciej rozwijającą się grupą wśród narzędzi OLAP, dzięki możliwości analizowania coraz większych baz danych, porównując do struktur MOLAP. Jest to realizowane za pomocą relacyjnych systemów RDBMS, które wspomagają ROLAP, stosując warstwy metadanych, a tym samym omijając wymóg tworzenia statycznych struktur wielowymiarowych danych. W celu zwiększenia efektywności narzędzi ROLAP niektóre z nich są wyposażone w specjalizowane silniki SQL, które wspierają złożone wielowymiarowe analizy.

HOLAP - hybrydowy OLAP

Narzędzia HOLAP są przeprowadzane za pomocą bezpośrednich systemów RDBMS, lub wykorzystując pośrednie systemy MOLAP. Tradycyjny system HOLAP przekazuje wybrane dane przez serwer MOLAP lub bezpośrednio z bazy danych do lokalnego serwera lub w sposób bezpośredni do stacji roboczej klienta w postaci kostek danych. System ten korzysta z dwóch technologii tj. ROLAP oraz MOLAP.

DOLAP – desktop OLAP

Narzędzia DOLAP przechowują dane klasy OLAP w środowisku użytkownika, a także obsługują wielowymiarowe przetwarzanie, dzięki wykorzystaniu lokalnych silników wspomagających ten proces. Wymagają one niewielkich fragmentów danych, rozpowszechniając je z góry lub na żądanie, np. wykorzystując sieć internetową. Zarządzanie bazami DOLAP odbywa się za pomocą centralnego serwera, specjalnych procedur odpowiedzialnych za przygotowanie kostek danych albo zestawy danych dla poszczególnych klientów/użytkowników (D. Dymek, W. Komnata, L. Kotulski, P. Szwed, 2015, s. 51-52).

Bibliografia

Autor: Krzysztof Woźniak, Karolina Kulig