Metody taksonomiczne

Metody taksonomiczne
Polecane artykuły

Taksonomia numeryczna - to dyscyplina zajmująca się zasadami i procedurami porządkowania oraz klasyfikacji. Zadaniem metod taksonomicznych jest pogrupowanie zbioru elementów dowolnej natury \(\Omega\,\!\) na bardziej jednorodne statystycznie podzbiory spełniające zarazem formalne warunki rozłączności, zupełności oraz niepustości.

Historia

Taksonomia to wywodząca się z nauk biologicznych dyscyplina, wykorzystywana początkowo do klasyfikacji organizmów żywych na podstawie ich cech anatomiczno- fizjologicznych. Sam termin ‘taksonomia’ wywodzi się z połączenia dwóch słów języka greckiego: taksis – ‘uporządkowanie’ + nomos – ‘prawo’, ‘zasada’.

Początkowo kryteria klasyfikacji były opisywane słownie. Przełomem było wprowadzenie na miejsce słownego opisu metod ilościowych na początku XX wieku. Pierwsza praca wykorzystująca metody ilościowe opublikowana została przez polskiego uczonego, Jana Czekanowskiego w 1913 roku. Jego badania to początek zastosowania taksonomii w innych dziedzinach nauki, takich jak: ekonomia, socjologia, antropologia, rolnictwo. Taksonomia oparta na zastosowaniu metod ilościowych to taksonomia numeryczna.

Obecnie taksonomia numeryczna znajduje zastosowanie w wielu dziedzinach nauki:

  • w ekonomii, np. do tworzenia portfela akcji.
  • w badaniach społeczno-ekonomicznych, np. do wyodrębnienia regionów, państw najuboższych w celu przyznania im pomocy międzynarodowych organizacji.
  • w medycynie, np. do przewidywania przekształceń wirusa gryp w celu znalezienia szczepionki dla nowego szczepu tego wirusa.
  • w przemyśle rozrywkowym, np. do przewidywania, czy wprowadzony do ramówki nowy serial ma szansę stać się hitem.

Podział metod taksonomicznych

Najbardziej ogólny i najbardziej przydatny podział wszystkich metod taksonomicznych wyróżnia:

  • metody hierarchizacji (hierarchiczne i niehierarchiczne).
  • metody grupowania (aglomeracyjne i podziałowe).
  • metody obszarowe.
  • metody optymalizacyjne.

Metody hierarchizacji

  • Metody hierarchiczne Metody hierarchiczne prowadzą do wyodrębnienia pełnej hierarchii. Metody te tworzą struktury skupień, które można przedstawić za pomocą dendrogramu.
  1. Metody porządkowania liniowego Określają one liniową hierarchię obiektów na podstawie ich odległości od tzw. wzorca rozwoju. Po ujednoliceniu cech, za współrzędne wzorca przyjmuje się maksymalne wartości zaobserwowanych cech (dla wzorca) lub minimalne (dla antywzorca). W metodach stosuje się różne miary wykorzystywane do obliczenia odległości wykorzystywane do obliczenia odległości poszczególnych elementów zbioru od wzorca. Najczęściej wykorzystywane to odległość Euklidesowa lub odległość miejska (Hamminga). Inną metodą porządkowania liniowego jest metoda sum standaryzowanych wartości, W tej metodzie dla każdego obiektu sumuje się zestandaryzowane wcześniej wartości, a następnie konstruuje względny wskaźnik poziomu rozwoju. Metodę tą można stosować również wtedy, kiedy wartości maksymalne dla stymulant nie są wartościami optymalnymi.
  2. metody dendrytowe (Taksonomia wrocławska)
  3. metody hierarchizacji drzewkowej (metoda najbliższego, najdalszego sąsiedztwa, metoda środka ciężkości, metoda J.H Warda)
  • Metody niehierarchiczne W metodach niehierarchicznych nie jest możliwe przedstawienie na dendogramieprocesu tworzenia skupisk.

Do najważniejszych metod niehierarchicznych należy zaliczyć metodę k- średnich oraz EM.

Metody grupowania

  • Metody aglomeracyjne - w metodach tych obiekty traktowane są na początku jako osobne skupienia (grupy)Proces klasyfikacji polega na łączeniu się w pary, na podstawie macierzy odległości, najbliższych podgrup aż do otrzymania jednej grupy, w której znajdują się wszystkie elementy zbioru \(\Omega\,\!\). Do metod aglomeracyjnych zalicza się m.in.: metoda najbliższego, najdalszego sąsiedztwa, metoda mediany, metoda średniej grupowej, metoda J.H. Warda.
  • Metody podziałowe - w metodach tych postępowanie jest odwrotne niż w metodach aglomeracyjnych, tzn. dzieli się grupę \(\Omega\,\!\) na jednoelementowe grupy. Do metod podziałowych zalicza się: metodę wrocławską, metodę jednakowego natężenia, metody iteracyjne (np. metoda J. Czekanowskiego, metoda k- średnich)

Metody obszarowe

Metody obszarowe mogą być metodami hierarchicznymi lub niechierarchicznymi. W metodach obszarowych dzieli się hiperprzestrzeń na rozłączne podprzestrzenie. Charakteryzują się one większą gęstością obiektów i są oddzielone obszarami o mniejszej gęstości obiektów. Do metod obszarowych należą: taksonomia hiperkul, taksonomia stochastyczna, metoda Thorndike’a, metoda Hartigana, metoda katowicka.

Metody optymalizacyjne

Metody optymalizacyjne mają za zadanie poprawienie wstępnego podziału zbioru punktów danej klasyfikacji. Polegają one na przenoszeniu obiektów ze swoich zbiorów do innych zbiorów i sprawdzaniu, czy przesunięcie obiektu poprawiło jakość całego podziału. Do metod optymalizacyjnych należą: metoda środków ciężkości, metoda Forgy- Janceya, metoda Wisharta.

Taksonomiczne oceny właściwości zbiorów elementów

W taksonomii wyróżniamy dwie możliwości ocenienia danych cech zbiorów elementów. Pierwszą z nich jest ocena statyczna a drugą ocena dynamiczna. Metody taksonomiczne powstały z potrzeby analizowania porównań przedmiotów, które charakteryzuje duża liczba zmiennych (Pluta W.,1977, s. 19).

Statyczna ocena właściwości zbioru elementów Z. Hellwing zasugerował jeden z początkowych pomysłów wykonania badań na przedmiotach wielocechowych. Jest to taksonomiczna miara rozwoju. "Miernik ten jest wielkością syntetyczną będącą wypadkową wszystkich zmiennych określających jednostki badanej zbiorowości” (Pluta W., 1977, s. 20). Stosuje się go aby uporządkować cząstki danego zbioru. Schemat tworzenia taksonomicznej miary rozwoju należy zacząć od utworzenia macierzy obserwacji X. Zmienne są elementami macierzy, wyrażone w odpowiednich jednostkach. Zmienne muszą przejść standaryzację. Kolejnym etapem jest podział zmiennych na stymulanty i destymulanty, dzięki czemu można stworzyć tzw. wzorzec rozwoju. Otrzymane wyniki powinne zostać poddane interpretacji.

Dynamiczna ocena właściwości zbioru elementów Jednoczesne badania paru jednostek statystycznych należy zacząć od wybrania zbioru zmiennych. W pojedynczej macierzy znajdują się zmienne, które pokazują właściwości jednostek statystycznych. Zbiorowa macierz obserwacji występuje w postaci macierzy blokowej. Kolejno powinno się wyznaczyć współrzędne wzorca rozwoju. Macierz skonstruowana tym sposobem ukazuje badaną część rzeczywistości wszystkich jednostek statystycznych. Następnie należy określić wpływy zmian indywidualnych miar rozwoju na zbiorczą miarę. W ten sposób można ocenić dynamikę pojedynczych miar rozwoju w stosunku do wszystkich miar ogółem. Otrzymana wielkość obiera wartości w przedziale (0,1). Wynik należy zinterpretować i poddać go ocenie jako negatywny bądź pozytywny. Wartości dodatnie świadczą o wyniku pozytywnym, a ujemne o wyniku negatywnym (Pluta W., 1977, s. 24-28).

Bibliografia

Autor: Danuta Tomera, Joanna Spyrka