Hurtownia danych: Różnice pomiędzy wersjami
m (cleanup bibliografii i rotten links) |
m (cleanup bibliografii i rotten links) |
||
(Nie pokazano 8 wersji utworzonych przez 2 użytkowników) | |||
Linia 1: | Linia 1: | ||
'''[[Hurtownia]] danych''' jest to scentralizowana, nietransakcyjna [[baza danych]], przeznaczona do przechowywania [[informacja|informacji]] globalnie w skali instytucji w długim horyzoncie czasowym, w wielowymiarowych układach analitycznych i ukierunkowana na wyszukiwanie informacji bezpośrednio przez jej użytkowników. | '''[[Hurtownia]] danych''' jest to scentralizowana, nietransakcyjna [[baza danych]], przeznaczona do przechowywania [[informacja|informacji]] globalnie w skali instytucji w długim horyzoncie czasowym, w wielowymiarowych układach analitycznych i ukierunkowana na wyszukiwanie informacji bezpośrednio przez jej użytkowników. | ||
Podstawowymi cechami hurtowni danych jest: uporządkowanie tematyczne różnych obszarów analitycznych, integracja danych z różnych systemów baz danych, trwałość zapisanych i przechowywanych danych, uwzględnienie wymiaru czasowego. | Podstawowymi cechami hurtowni danych jest: uporządkowanie tematyczne różnych obszarów analitycznych, integracja danych z różnych systemów baz danych, trwałość zapisanych i przechowywanych danych, uwzględnienie wymiaru czasowego. | ||
Hurtownia danych jest dynamiczną infrastrukturą, która łączy bazy danych, oprogramowanie i sprzęt w zintegrowaną całość, zmieniającą się wraz z rozwojem przedsiębiorstwa. Konstrukcja hurtowni danych składa się z trzech obszarów: jądra systemu, perspektywy operacyjnej oraz perspektywy menadżerskiej | Hurtownia danych jest dynamiczną infrastrukturą, która łączy bazy danych, oprogramowanie i sprzęt w zintegrowaną całość, zmieniającą się wraz z rozwojem przedsiębiorstwa. Konstrukcja hurtowni danych składa się z trzech obszarów: jądra systemu, perspektywy operacyjnej oraz perspektywy menadżerskiej (M. Nycz, 2012, s. 11) | ||
==TL;DR== | ==TL;DR== | ||
Linia 29: | Linia 14: | ||
Fakty to najistotniejszy obszar w hurtowni danych, ponieważ są one podstawą do dokonania bezpośrednio różnorakich analiz. Mogą one osiągać bardzo dużą objętość, nawet do rzędu terabajtów, jeśli zawierają dużą liczbę danych historycznych niezbędnych do analiz.(M. Nycz 2012, s. 12) | Fakty to najistotniejszy obszar w hurtowni danych, ponieważ są one podstawą do dokonania bezpośrednio różnorakich analiz. Mogą one osiągać bardzo dużą objętość, nawet do rzędu terabajtów, jeśli zawierają dużą liczbę danych historycznych niezbędnych do analiz.(M. Nycz 2012, s. 12) | ||
<google> | <google>n</google> | ||
==Hurtownia danych a systemy źródłowe== | ==Hurtownia danych a systemy źródłowe== | ||
[[System operacyjny|Systemy operacyjne]], transakcyjne, obsługujące dane źródłowe dla hurtowni, są określane jako OLTP (''online trans action processing''). Aplikacje te, najczęściej typu [[klient]]/serwer, zapewniają użytkownikowi bezpośredni dostęp do danych, na których inicjuje przeprowadzenie transakcji. | [[System operacyjny|Systemy operacyjne]], transakcyjne, obsługujące dane źródłowe dla hurtowni, są określane jako OLTP (''online trans action processing''). Aplikacje te, najczęściej typu [[klient]]/serwer, zapewniają użytkownikowi bezpośredni dostęp do danych, na których inicjuje przeprowadzenie transakcji. | ||
Opozycję stanowią hurtownie danych, w których [[informacja]] raz wprowadzona jest niezmienna. Fundamentalną zasadą jest to, że dane z hurtowni nigdy nie są usuwane, a wszelkie aktualizacje są normalnie obsługiwane off-line hurtowni danych. | Opozycję stanowią hurtownie danych, w których [[informacja]] raz wprowadzona jest niezmienna. Fundamentalną zasadą jest to, że dane z hurtowni nigdy nie są usuwane, a wszelkie aktualizacje są normalnie obsługiwane off-line hurtowni danych. | ||
Rozwiązania transakcyjne mają na celu szybkie przeprocesowanie prostych operacji, lecz nie mają [[zdolności]] do obsługi przekrojowych, złożonych zapytań, uwzględniających m.in. dane historyczne. Zatem hurtownia danych stanowi najlepsze rozwiązanie do przygotowywania raportów oraz analiz szczebla strategicznego | Rozwiązania transakcyjne mają na celu szybkie przeprocesowanie prostych operacji, lecz nie mają [[zdolności]] do obsługi przekrojowych, złożonych zapytań, uwzględniających m.in. dane historyczne. Zatem hurtownia danych stanowi najlepsze rozwiązanie do przygotowywania raportów oraz analiz szczebla strategicznego (D. Dymek, W. Komnata, L. Kotulski, P. Szwed 2015, s. 22-23) | ||
==Zadania hurtowni danych== | ==Zadania hurtowni danych== | ||
Generalnym zadaniem hurtowni danych jest ujęcie w postaci ujednoliconej istotnych w skali [[firma|firmy]] (krytycznych) informacji [[gospodarka|gospodarczych]] oraz udostępnienie ich do [[potrzeba|potrzeb]] analizy zagadnień decyzyjnych, odpowiedzi na zapytania i raportowania. | Generalnym zadaniem hurtowni danych jest ujęcie w postaci ujednoliconej istotnych w skali [[firma|firmy]] (krytycznych) informacji [[gospodarka|gospodarczych]] oraz udostępnienie ich do [[potrzeba|potrzeb]] analizy zagadnień decyzyjnych, odpowiedzi na zapytania i raportowania. | ||
==Problemy hurtowni danych== | ==Problemy hurtowni danych== | ||
Budowie i zarządzaniu hurtownią danych mogą towarzyszyć pewne problemy, których poznanie powinno pomóc lepiej projektować, a także unikać ich w procesie realizacji. | Budowie i zarządzaniu hurtownią danych mogą towarzyszyć pewne problemy, których poznanie powinno pomóc lepiej projektować, a także unikać ich w procesie realizacji. | ||
Linia 53: | Linia 40: | ||
==Rola w podejmowaniu decyzji== | ==Rola w podejmowaniu decyzji== | ||
Zasadniczą zasadą, na której opiera się koncepcja hurtowni danych jest umożliwienie łatwego dostępu do danych z różnych istniejących i pozostających nadal w użyciu baz (różnych operacyjnych, transakcyjnych systemów informatycznych), poprzez jedną wielowymiarową bazę danych. Dane w hurtowni nie są uaktualniane w czasie rzeczywistym (na bieżąco) jak w bazach [[transakcja|transakcyjnych]] (operacyjnych), lecz okresowo (Gorawski M., 2000, s. 30-33). Systemy [[DSS]] oraz [[System informowania kierownictwa|EIS]] mogą czytać dane wprost z hurtowni lub dane mogą być kopiowane do innych mniejszych, tematycznych hurtowni danych (ang. ''Data Mart''). | Zasadniczą zasadą, na której opiera się koncepcja hurtowni danych jest umożliwienie łatwego dostępu do danych z różnych istniejących i pozostających nadal w użyciu baz (różnych operacyjnych, transakcyjnych systemów informatycznych), poprzez jedną wielowymiarową bazę danych. Dane w hurtowni nie są uaktualniane w czasie rzeczywistym (na bieżąco) jak w bazach [[transakcja|transakcyjnych]] (operacyjnych), lecz okresowo (Gorawski M., 2000, s. 30-33). Systemy [[DSS]] oraz [[System informowania kierownictwa|EIS]] mogą czytać dane wprost z hurtowni lub dane mogą być kopiowane do innych mniejszych, tematycznych hurtowni danych (ang. ''Data Mart''). | ||
Środowisko hurtowni danych jest z założenia nadmiarowe. Wiele systemów baz danych dla obsługi [[przedsiębiorstwo|przedsiębiorstwa]] i systemów archiwalnych umieszcza dane we wspólnej bazie, która z kolei może być powielona w jednej lub kilku hurtowniach tematycznych. Sposób ekstrakcji danych z systemów [[produkcja|produkcyjnych]] do hurtowni danych powinien być opisany przez odpowiednie [[procedury i instrukcje|procedury]] zgodne z charakterem danych i potrzebami analitycznymi użytkowników. | Środowisko hurtowni danych jest z założenia nadmiarowe. Wiele systemów baz danych dla obsługi [[przedsiębiorstwo|przedsiębiorstwa]] i systemów archiwalnych umieszcza dane we wspólnej bazie, która z kolei może być powielona w jednej lub kilku hurtowniach tematycznych. Sposób ekstrakcji danych z systemów [[produkcja|produkcyjnych]] do hurtowni danych powinien być opisany przez odpowiednie [[procedury i instrukcje|procedury]] zgodne z charakterem danych i potrzebami analitycznymi użytkowników. | ||
Poziom [[decyzja|decyzji]] podejmowanych w oparciu o [[system]]y DSS oraz EIS zazwyczaj nie wymaga uaktualniania danych z dokładnością do minut. Dane w ''Data Mart'' i ''Data Warehouse'' nie są w pełni zsynchronizowane z danymi w systemach produkcji, [[sprzedaż]]y i w systemach [[marketing]]owych, lecz są uaktualniane w pewnych odstępach czasu. Fakt ten pozwala na przechowywanie danych w hurtowni w sposób nadmiarowy, pozwalając skrócić czas niezbędny do uzyskania odpowiedzi systemu i rozwiązania zadań analitycznych. | Poziom [[decyzja|decyzji]] podejmowanych w oparciu o [[system]]y DSS oraz EIS zazwyczaj nie wymaga uaktualniania danych z dokładnością do minut. Dane w ''Data Mart'' i ''Data Warehouse'' nie są w pełni zsynchronizowane z danymi w systemach produkcji, [[sprzedaż]]y i w systemach [[marketing]]owych, lecz są uaktualniane w pewnych odstępach czasu. Fakt ten pozwala na przechowywanie danych w hurtowni w sposób nadmiarowy, pozwalając skrócić czas niezbędny do uzyskania odpowiedzi systemu i rozwiązania zadań analitycznych. | ||
{{infobox5|list1={{i5link|a=[[System informacji menedżerskiej]]}} — {{i5link|a=[[Korporacyjna deska rozdzielcza]]}} — {{i5link|a=[[Systemy wspomagania decyzji]]}} — {{i5link|a=[[Informatyczne systemy zarządzania produkcją]]}} — {{i5link|a=[[System ekspercki]]}} — {{i5link|a=[[Systemy ekspertowe]]}} — {{i5link|a=[[Systemy OLAP]]}} — {{i5link|a=[[System informacyjny]]}} — {{i5link|a=[[System zarządzania przebiegiem procesów]]}} }} | |||
==Bibliografia== | ==Bibliografia== | ||
<noautolinks> | <noautolinks> | ||
* Connoly T., Begg C. | * Connoly T., Begg C. (2015), ''Database Systems, A Practical Approach to Design'', Addison Wesley, Pearson Education, London | ||
* Dymek D., Komnata W., Kotulski L., Szwed P. | * Dymek D., Komnata W., Kotulski L., Szwed P. (2015), ''Architektury hurtowni danych'', Wydawnictwa AGH, Kraków | ||
* Gorawski M. | * Gorawski M. (2000), ''Hurtownia danych'', Informatyka, nr 3 | ||
* Kopczewski M. | * Kopczewski M. (2014), ''Hurtownie danych narzędziem wspomagającym procesy decyzyjne w zarządzaniu'', Zeszyty naukowe Uniwersytetu Przyrodniczo-Humanistycznego w Siedlcach, WSB Poznań, nr 100 | ||
* Morzy M. | * Morzy M. (2004), ''[https://www.cs.put.poznan.pl/mmorzy/papers/cpi04.pdf Aktywne hurtownie danych]'', Instytut Informatyki Politechniki Poznańskiej, Poznań | ||
* Nycz M. | * Nycz M. (2012), ''Hurtownie danych i business intelligence w organizacji'', Uniwersytet Ekonomiczny we Wrocławiu, Wrocław | ||
* Woźniak K. | * Woźniak K. (2005), ''System informacji menedżerskiej jako instrument zarządzania strategicznego w firmie'', praca doktorska, Akademia Ekonomiczna w Krakowie, Kraków | ||
</noautolinks> | </noautolinks> | ||
Aktualna wersja na dzień 13:19, 7 sty 2024
Hurtownia danych jest to scentralizowana, nietransakcyjna baza danych, przeznaczona do przechowywania informacji globalnie w skali instytucji w długim horyzoncie czasowym, w wielowymiarowych układach analitycznych i ukierunkowana na wyszukiwanie informacji bezpośrednio przez jej użytkowników. Podstawowymi cechami hurtowni danych jest: uporządkowanie tematyczne różnych obszarów analitycznych, integracja danych z różnych systemów baz danych, trwałość zapisanych i przechowywanych danych, uwzględnienie wymiaru czasowego.
Hurtownia danych jest dynamiczną infrastrukturą, która łączy bazy danych, oprogramowanie i sprzęt w zintegrowaną całość, zmieniającą się wraz z rozwojem przedsiębiorstwa. Konstrukcja hurtowni danych składa się z trzech obszarów: jądra systemu, perspektywy operacyjnej oraz perspektywy menadżerskiej (M. Nycz, 2012, s. 11)
TL;DR
Hurtownia danych to scentralizowana baza danych, która przechowuje informacje globalnie w długim okresie czasu. Dane w hurtowni są statyczne i głównie przeznaczone do odczytu. Hurtownia danych jest wykorzystywana do podejmowania decyzji i analizy zagadnień decyzyjnych. Budowa i zarządzanie hurtownią danych może wiązać się z różnymi problemami. Hurtownia danych umożliwia łatwy dostęp do danych z różnych baz danych. Dane w hurtowni nie są uaktualniane w czasie rzeczywistym, ale okresowo. Środowisko hurtowni danych jest nadmiarowe, co pozwala na skrócenie czasu uzyskania odpowiedzi i rozwiązania zadań analitycznych.
Cechy danych
Dane gromadzone dla celów podejmowania decyzji w bazie danych mierzone są w trzech wymiarach: głębokość odnosi się do liczby danych sumarycznych - zagregowanych, szerokość danych odnosi się do dostępności danych w odniesieniu do liczby wymiarów i atrybutów, które mogą być analizowane przez użytkownika, szczegółowość danych ("atomowość") określa liczbę wystąpień - ziarnistość danych.
Dane w hurtowni danych zazwyczaj są statyczne i głównie przeznaczone do odczytu. Ze względu na to, iż dane reprezentują pewien przedział czasowy, nie mogą być aktualizowane i nie ma zwykle możliwości ich zmiany. Dane są uaktualniane jedynie w swoich systemach źródłowych i następnie dostarczane do hurtowni z odpowiednim stemplem czasowym. Jedyne operacje wykonywane na tym etapie, to wprowadzanie i agregacja danych podczas procesu ładowania, a następnie selekcja nowych danych w zapytaniach. W hurtowni danych wyróżniamy cztery główne kategorie danych. Stanowią je fakty, dane zagregowane, wymiary i metadane. Fakty to najistotniejszy obszar w hurtowni danych, ponieważ są one podstawą do dokonania bezpośrednio różnorakich analiz. Mogą one osiągać bardzo dużą objętość, nawet do rzędu terabajtów, jeśli zawierają dużą liczbę danych historycznych niezbędnych do analiz.(M. Nycz 2012, s. 12)
Hurtownia danych a systemy źródłowe
Systemy operacyjne, transakcyjne, obsługujące dane źródłowe dla hurtowni, są określane jako OLTP (online trans action processing). Aplikacje te, najczęściej typu klient/serwer, zapewniają użytkownikowi bezpośredni dostęp do danych, na których inicjuje przeprowadzenie transakcji. Opozycję stanowią hurtownie danych, w których informacja raz wprowadzona jest niezmienna. Fundamentalną zasadą jest to, że dane z hurtowni nigdy nie są usuwane, a wszelkie aktualizacje są normalnie obsługiwane off-line hurtowni danych. Rozwiązania transakcyjne mają na celu szybkie przeprocesowanie prostych operacji, lecz nie mają zdolności do obsługi przekrojowych, złożonych zapytań, uwzględniających m.in. dane historyczne. Zatem hurtownia danych stanowi najlepsze rozwiązanie do przygotowywania raportów oraz analiz szczebla strategicznego (D. Dymek, W. Komnata, L. Kotulski, P. Szwed 2015, s. 22-23)
Zadania hurtowni danych
Generalnym zadaniem hurtowni danych jest ujęcie w postaci ujednoliconej istotnych w skali firmy (krytycznych) informacji gospodarczych oraz udostępnienie ich do potrzeb analizy zagadnień decyzyjnych, odpowiedzi na zapytania i raportowania.
Problemy hurtowni danych
Budowie i zarządzaniu hurtownią danych mogą towarzyszyć pewne problemy, których poznanie powinno pomóc lepiej projektować, a także unikać ich w procesie realizacji. Thomas Connolly i Carolyn Begg zgromadzili dziesięć aspektów problemów hurtowni danych (T. Connoly, C. Begg, 2005):
- nieprecyzyjne oszacowanie zasobów do ładowania danych,
- niejawne problemy z systemami źródłowymi,
- brak pozyskania wymaganych danych,
- rosnące żądania użytkowników,
- homogenizacja danych,
- wysokie zapotrzebowanie na zasoby,
- własność danych,
- wysokie koszty serwisu,
- długi czas trwania projektu,
- złożoność integracyjna.
Rola w podejmowaniu decyzji
Zasadniczą zasadą, na której opiera się koncepcja hurtowni danych jest umożliwienie łatwego dostępu do danych z różnych istniejących i pozostających nadal w użyciu baz (różnych operacyjnych, transakcyjnych systemów informatycznych), poprzez jedną wielowymiarową bazę danych. Dane w hurtowni nie są uaktualniane w czasie rzeczywistym (na bieżąco) jak w bazach transakcyjnych (operacyjnych), lecz okresowo (Gorawski M., 2000, s. 30-33). Systemy DSS oraz EIS mogą czytać dane wprost z hurtowni lub dane mogą być kopiowane do innych mniejszych, tematycznych hurtowni danych (ang. Data Mart).
Środowisko hurtowni danych jest z założenia nadmiarowe. Wiele systemów baz danych dla obsługi przedsiębiorstwa i systemów archiwalnych umieszcza dane we wspólnej bazie, która z kolei może być powielona w jednej lub kilku hurtowniach tematycznych. Sposób ekstrakcji danych z systemów produkcyjnych do hurtowni danych powinien być opisany przez odpowiednie procedury zgodne z charakterem danych i potrzebami analitycznymi użytkowników.
Poziom decyzji podejmowanych w oparciu o systemy DSS oraz EIS zazwyczaj nie wymaga uaktualniania danych z dokładnością do minut. Dane w Data Mart i Data Warehouse nie są w pełni zsynchronizowane z danymi w systemach produkcji, sprzedaży i w systemach marketingowych, lecz są uaktualniane w pewnych odstępach czasu. Fakt ten pozwala na przechowywanie danych w hurtowni w sposób nadmiarowy, pozwalając skrócić czas niezbędny do uzyskania odpowiedzi systemu i rozwiązania zadań analitycznych.
Hurtownia danych — artykuły polecane |
System informacji menedżerskiej — Korporacyjna deska rozdzielcza — Systemy wspomagania decyzji — Informatyczne systemy zarządzania produkcją — System ekspercki — Systemy ekspertowe — Systemy OLAP — System informacyjny — System zarządzania przebiegiem procesów |
Bibliografia
- Connoly T., Begg C. (2015), Database Systems, A Practical Approach to Design, Addison Wesley, Pearson Education, London
- Dymek D., Komnata W., Kotulski L., Szwed P. (2015), Architektury hurtowni danych, Wydawnictwa AGH, Kraków
- Gorawski M. (2000), Hurtownia danych, Informatyka, nr 3
- Kopczewski M. (2014), Hurtownie danych narzędziem wspomagającym procesy decyzyjne w zarządzaniu, Zeszyty naukowe Uniwersytetu Przyrodniczo-Humanistycznego w Siedlcach, WSB Poznań, nr 100
- Morzy M. (2004), Aktywne hurtownie danych, Instytut Informatyki Politechniki Poznańskiej, Poznań
- Nycz M. (2012), Hurtownie danych i business intelligence w organizacji, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław
- Woźniak K. (2005), System informacji menedżerskiej jako instrument zarządzania strategicznego w firmie, praca doktorska, Akademia Ekonomiczna w Krakowie, Kraków
Autor: Krzysztof Woźniak, Karolina Kulig