Eksploracja danych: Różnice pomiędzy wersjami

Z Encyklopedia Zarządzania
m (Dodanie MetaData Description)
m (cleanup bibliografii i rotten links)
 
(Nie pokazano 9 wersji utworzonych przez 2 użytkowników)
Linia 1: Linia 1:
{{infobox4
'''Eksploracja danych''' (ang. ''data mining'') jest to [[proces]] odkrywania uogólnionych reguł i [[wiedza|wiedzy]] zawartej w [[baza danych|bazach danych]] oparty o [[:Kategoria:Statystyka|metody statystyczne]] i techniki [[sztuczna inteligencja|sztucznej inteligencji]]. [[Wiedza]] ta nie wynika bezpośrednio z samych [[dane|danych]], ale z faktu, iż to właśnie takie, a nie inne [[dane]] znalazły się razem w jednej bazie danych <ref>, Strykowski S., s. 17 </ref>.
|list1=
<ul>
<li>[[Modelowanie procesów]]</li>
<li>[[7 narzędzi TQC]]</li>
<li>[[Sztuczne sieci neuronowe]]</li>
<li>[[Analiza danych]]</li>
<li>[[Konceptualizacja]]</li>
<li>[[DMAIC]]</li>
<li>[[Behavior driven development]]</li>
<li>[[Zarządzanie strategiczne]]</li>
<li>[[Cykl Deminga]]</li>
</ul>
}}
 
 
'''Eksploracja danych''' (ang. ''data mining'') jest to [[proces]] odkrywania uogólnionych reguł i [[wiedza|wiedzy]] zawartej w [[baza danych|bazach danych]] oparty o [[:Kategoria:Statystyka i Ekonometria|metody statystyczne]] i techniki [[sztuczna inteligencja|sztucznej inteligencji]]. [[Wiedza]] ta nie wynika bezpośrednio z samych [[dane|danych]], ale z faktu, iż to właśnie takie, a nie inne [[dane]] znalazły się razem w jednej bazie danych <ref>, Strykowski S., s. 17 </ref>.  


Niektórzy autorzy określają ''data mining'' jako nietrywialną ekstrakcję poprzednio nieznanej wiedzy z danych przechowywanych w [[hurtownia danych|hurtowni]]. Polega ono na wykrywania współzależności, tendencji na podstawie zgromadzonych [[Dane|danych]] za pomocą technik statystycznych, matematycznych i rozpoznawania prawidłowości występujących w danych <ref>, Ryznar Z., s. 10-14 </ref>.
Niektórzy autorzy określają ''data mining'' jako nietrywialną ekstrakcję poprzednio nieznanej wiedzy z danych przechowywanych w [[hurtownia danych|hurtowni]]. Polega ono na wykrywania współzależności, tendencji na podstawie zgromadzonych [[Dane|danych]] za pomocą technik statystycznych, matematycznych i rozpoznawania prawidłowości występujących w danych <ref>, Ryznar Z., s. 10-14 </ref>.
Linia 31: Linia 15:
* '''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''). Twórcami tego modelu są NCR Systems Engineering Copenhagen, SPSS/Integraf Solutions Ltd., Daimler-Chrysler oraz OHRA Verzekeringen [[Bank]] Group B.V.
* '''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''). Twórcami tego modelu są NCR Systems Engineering Copenhagen, SPSS/Integraf Solutions Ltd., Daimler-Chrysler oraz OHRA Verzekeringen [[Bank]] Group B.V.
Ich zdaniem [[model]] eksploracji danych składa się z sześciu etapów:
Ich zdaniem [[model]] eksploracji danych składa się z sześciu etapów:
<google>n</google>


1. Zrozumienie uwarunkowań biznesowych.
1. Zrozumienie uwarunkowań biznesowych.
Linia 64: Linia 50:


5. [[Kontrola]].
5. [[Kontrola]].
* '''VcofDM''' (''Virtuos Cycle of Data Mining'') zaprojektowany przez M. J. A. Berrego i G. Linoffa, wybitych specjalistów dziedziny eksploracji danych. Składa się z czterech etapów:  
* '''VcofDM''' (''Virtuos Cycle of Data Mining'') zaprojektowany przez M. J. A. Berrego i G. Linoffa, wybitych specjalistów dziedziny eksploracji danych. Składa się z czterech etapów:


1. Zidentyfikowanie problemów biznesowych.  
1. Zidentyfikowanie problemów biznesowych.


2. Przekształcenie danych w informacje.
2. Przekształcenie danych w informacje.
Linia 85: Linia 71:
==Wykorzystanie==
==Wykorzystanie==
Eksploracja danych przynosi wymierne korzyści w różnych obszarach [[Zarządzanie|zarządzania]]. Przykłady zastosowań eksploracji danych to:
Eksploracja danych przynosi wymierne korzyści w różnych obszarach [[Zarządzanie|zarządzania]]. Przykłady zastosowań eksploracji danych to:
<google>ban728t</google>
* [[identyfikacja]] wzorców zachowań [[klient]]ów przy dokonywaniu zakupów,
* [[identyfikacja]] wzorców zachowań [[klient]]ów przy dokonywaniu zakupów,
* wykrywanie powiązań pomiędzy charakterystykami demograficznymi klientów,
* wykrywanie powiązań pomiędzy charakterystykami demograficznymi klientów,
Linia 93: Linia 78:
* opracowanie [[dystrybucja|planu dystrybucji towarów]] pomiędzy [[rynek|rynkami zbytu]].
* opracowanie [[dystrybucja|planu dystrybucji towarów]] pomiędzy [[rynek|rynkami zbytu]].


==Bibliografia==
{{infobox5|list1={{i5link|a=[[Modelowanie procesów]]}} &mdash; {{i5link|a=[[7 narzędzi TQC]]}} &mdash; {{i5link|a=[[Sztuczne sieci neuronowe]]}} &mdash; {{i5link|a=[[Analiza danych]]}} &mdash; {{i5link|a=[[Konceptualizacja]]}} &mdash; {{i5link|a=[[DMAIC]]}} &mdash; {{i5link|a=[[Behavior driven development]]}} &mdash; {{i5link|a=[[Zarządzanie strategiczne]]}} &mdash; {{i5link|a=[[Cykl Deminga]]}} }}
* Morzy T. (1999) ''[http://informatykaug.internetdsl.pl/student/Informatyka/Exploracja%20danych%20problemy%20i%20rozwiazania.pdf Eksploracja danych: problemy i rozwiązania]'' V [[Konferencja]] PLOUG, Zakopane
* Olszak C. (2018) ''[http://ptzp.org.pl/files/konferencje/kzz/artyk_pdf_2009/092_Olszak_Bartus.pdf Analiza i ocena wybranych modeli eksploracji danych]  
* Ryznar Z. (1998) ''Istota i zadania hurtowni danych'', "[[Informatyka]]", nr 11
* Strykowski S. (1996) ''Eksploracja danych'', "Informatyka" nr 10
* Woźniak K.(2005) ''[[System]] informacji menedżerskiej jako instrument zarządzania strategicznego w firmie'', [[praca]] doktorska, Akademia Ekonomiczna w Krakowie, Kraków


==Przypisy==
==Przypisy==
<references/>
<references />
 
==Bibliografia==
<noautolinks>
* Morzy T. (1999), ''Eksploracja danych: problemy i rozwiązania'', V Konferencja PLOUG, Zakopane
* Olszak C. (2018), ''Analiza i ocena wybranych modeli eksploracji danych''
* Ryznar Z. (1998), ''Istota i zadania hurtowni danych'', Informatyka, nr 11
* Strykowski S. (1996), ''Eksploracja danych'', Informatyka, nr 10
* Woźniak K. (2005), ''System informacji menedżerskiej jako instrument zarządzania strategicznego w firmie'', praca doktorska, Akademia Ekonomiczna w Krakowie, Kraków
</noautolinks>


{{a|[[Krzysztof Woźniak]], Karolina Gralak}}
{{a|[[Krzysztof Woźniak]], Karolina Gralak}}
[[Kategoria:Zarządzanie informacjami]]
[[Kategoria:Zarządzanie informacjami]]
<!--[[en:Information]]-->


{{#metamaster:description|Odkryj ukrytą wiedzę w danych dzięki eksploracji danych. Wykorzystuje ona statystykę, sztuczną inteligencję i matematykę do wykrywania trendów i przyczyn problemów biznesowych.}}
{{#metamaster:description|Odkryj ukrytą wiedzę w danych dzięki eksploracji danych. Wykorzystuje ona statystykę, sztuczną inteligencję i matematykę do wykrywania trendów i przyczyn problemów biznesowych.}}

Aktualna wersja na dzień 18:54, 17 gru 2023

Eksploracja danych (ang. data mining) jest to proces odkrywania uogólnionych reguł i wiedzy zawartej w bazach danych oparty o metody statystyczne i techniki sztucznej inteligencji. Wiedza ta nie wynika bezpośrednio z samych danych, ale z faktu, iż to właśnie takie, a nie inne dane znalazły się razem w jednej bazie danych [1].

Niektórzy autorzy określają data mining jako nietrywialną ekstrakcję poprzednio nieznanej wiedzy z danych przechowywanych w hurtowni. Polega ono na wykrywania współzależności, tendencji na podstawie zgromadzonych danych za pomocą technik statystycznych, matematycznych i rozpoznawania prawidłowości występujących w danych [2].

Ponadto eksploracja danych jest także:

  • klasycznym narzędziem, które generuje sprawozdania i analizy,
  • procesem, który jest automatyczny i nie wymaga nadzorowania ze strony człowieka,
  • odszukuje przyczyny problemów przedsiębiorstw lub biznesowych,
  • pomimo swojej złożoności jest procesem szybkim [3].

TL;DR

Eksploracja danych to proces odkrywania ukrytej wiedzy w bazach danych za pomocą statystyki i sztucznej inteligencji. Istnieją różne modele i metody eksploracji danych, które pomagają w analizie i generowaniu raportów. Eksploracja danych ma wiele zastosowań w zarządzaniu, takich jak identyfikacja wzorców zachowań klientów, wykrywanie powiązań demograficznych, czy określanie prawidłowości zmian cen akcji.

Modele eksploracji danych

  • CRISP-DM (Cross-Industry Standard Process for Data Mining). Twórcami tego modelu są NCR Systems Engineering Copenhagen, SPSS/Integraf Solutions Ltd., Daimler-Chrysler oraz OHRA Verzekeringen Bank Group B.V.

Ich zdaniem model eksploracji danych składa się z sześciu etapów:

1. Zrozumienie uwarunkowań biznesowych.

2. Zrozumienie danych.

3. Przygotowanie danych.

4. Modelowanie - czyli wybór technik, które będą użyte do utworzenia modelu eksploracji danych.

5. Ewaluacja - ocena modelu, jego testowanie i ponowne przejrzenie jego konstrukcji.

6. Wdrożenie.

  • SEMMA (Sample, Explore, Modify, Model, Assess), zaprojektowany przez SAS Institute. W jego skład wchodzi pięć etapów:

1. Próbkowanie - wykorzystanie tylko części danych, zanim całość zostanie wprowadzona.

2. Eksplorowanie - w celu głębszego poznania danych.

3. Manipulacja - po etapie eksplorowanie, często potrzebna jest modyfikacja danych

4. Modelowanie - czyli wybór techniki modelowania.

5. Ocena.

  • DMAIC (Define, Measure, Analyze, Improve, Control), oparty na strategii Six Sigma. Stworzony przez inżynierów z Instytutu Motoroli. Model skupia się na eliminacji strat i defektów, problemów z jakością w rożnych dziedzinach biznesu. Składa się z pięciu etapów:

1. Definiowanie - określenie celów i identyfikacja problemów biznesowych.

2. Pomiar - zbierane są informacje o aktualnym stanie procesu.

3. Analiza - zdefiniowanie krytycznych przyczyn problemów, uzasadnienie ich wpływu na proces.

4. Usprawnienie - wprowadzanie odpowiednich rozwiązań.

5. Kontrola.

  • VcofDM (Virtuos Cycle of Data Mining) zaprojektowany przez M. J. A. Berrego i G. Linoffa, wybitych specjalistów dziedziny eksploracji danych. Składa się z czterech etapów:

1. Zidentyfikowanie problemów biznesowych.

2. Przekształcenie danych w informacje.

3. Podjęcie działań.

4. Mierzenie i ocena wyników [4].

Metody eksploracji danych

Metody eksploracji danych są dzielone na 6 podstawowych klas:

  1. Klastrowanie - głównym celem tych metod jest odnajdowanie w bazie danych skończonych zbiorów klas obiektów, czyli klastrów, posiadających podobne cechy. Owy proces klastrowania przebiega bardzo często w dwóch cyklach: cykl zewnętrzny, który przebiega po liczbie możliwych klastrów; cykl wewnętrzny, próbujący odnaleźć optymalny podział między klastry.
  2. Odkrywanie asocjacji - jest to najrozleglejsza klasa metod. Obejmuje odkrywanie różnego rodzaju nieznanych współzależności w bazie danych. Jest to przede wszystkim odkrywanie asocjacji między obiektami.
  3. Odkrywanie wzorców sekwencji - czyli odkrywanie wzorców zachowań czasowych, na przykład sekwencja notowań giełdowych, zachowania klientów supermarketów.
  4. Wykrywanie zmian i odchyleń - odnajdywanie różnic pomiędzy oczekiwanymi a aktualnymi wartościami danych, na przykład odnajdywanie anomalnych zachowań klientów firm telekomunikacyjnych.
  5. Odkrywanie zbieżności w przebiegach czasowych - odnajdywanie podobieństw w czasowych przebiegach, które opisują określone procesy.
  6. Odkrywanie klasyfikacji - do głównego celu tych metod należy odnajdywanie zależności między klasyfikacją danych obiektów (taką wprowadzoną przez eksperta lub naturalną) a ich charakterystyką [5].

Wykorzystanie

Eksploracja danych przynosi wymierne korzyści w różnych obszarach zarządzania. Przykłady zastosowań eksploracji danych to:


Eksploracja danychartykuły polecane
Modelowanie procesów7 narzędzi TQCSztuczne sieci neuronoweAnaliza danychKonceptualizacjaDMAICBehavior driven developmentZarządzanie strategiczneCykl Deminga

Przypisy

  1. , Strykowski S., s. 17
  2. , Ryznar Z., s. 10-14
  3. , Olszak C., s. 253
  4. , Olszak C., s. 255-256
  5. , Morzy T., s. 4

Bibliografia

  • Morzy T. (1999), Eksploracja danych: problemy i rozwiązania, V Konferencja PLOUG, Zakopane
  • Olszak C. (2018), Analiza i ocena wybranych modeli eksploracji danych
  • Ryznar Z. (1998), Istota i zadania hurtowni danych, Informatyka, nr 11
  • Strykowski S. (1996), Eksploracja danych, Informatyka, nr 10
  • Woźniak K. (2005), System informacji menedżerskiej jako instrument zarządzania strategicznego w firmie, praca doktorska, Akademia Ekonomiczna w Krakowie, Kraków


Autor: Krzysztof Woźniak, Karolina Gralak