Metadane

Metadane
Polecane artykuły

Metadane to inaczej "dane o danych”, lub też "informacja o informacji”. Są to określenia umożliwiające wyszukanie pożądanej informacji wraz z odpowiedzią w jakiej relacji pozostaje ona do innych informacji. Opisując więc zbiory danych przestrzennych powinny powinny zawierać informację o rodzaju obiektów, ich położeniu, pochodzeniu a także dotyczące ich szczegółowości, standardów, praw własności i praw autorskich, cen jak również sposobach uzyskania dostępu do danych oraz warunkach użycia ich w określonym celu. Najczęstszym podawanym przykładem metadanch jest katalog biblioteczny.

Dla poprawnego zarządzania metadanymi ważne jest aby były jednoznaczne w swej zawartości bez względu na to przez kogo zostały utworzone. Unormowania te opisują dokumenty Międzynarodowej Standaryzacji (ISO):

  • Norma ISO 19115
  • Specyfikacja techniczna ISO/CD TS 19139

Rodzaje metadanych:

  • Metadane wyszukiwania - służą do wyboru zbiorów, mogą stać się przedmiotem zainteresowań danej osoby o konkretnych wymaganiach, obejmują one (A. Iwaniak 2005, s. 49), (K. Pater, T. Traczyk 2013, s. 91-92):"
  • nazwę i opis zbioru danych,
  • podstawowe przeznaczenie i zakres stosowania danych,
  • datę pozyskania danych i ich aktualizacji,
  • producenta, dostawcę i głównych użytkowników danych,
  • obszar, do którego dane się odnoszą (współrzędne);
  • nazwy geograficzne lub jednostki podziału administracyjnego;
  • strukturę zbiorów i sposób dostępu do danych".
  • Metadane rozpoznania-zawierają więcej szczegółów o zbiorze, umożliwiają:"
  • ocenę jakości danych,
  • określenie przydatności zbioru danych pod względem wymagań użytkowników,
  • nawiązanie kontaktu z dysponentem danych celem uzyskania dalszych informacji, w szczególności informacji na temat warunków korzystania z danych".
  • Metadane stosowania - zawierają szczegóły zbioru, które gwarantują:"
  • odczytania danych oraz ich transferu,
  • interpretacji danych i praktycznego korzystania z nich w aplikacji użytkownika".
  • Metadane konserwatorskie- jest to połączenie pozostałych rodzajów metadanych. Wspierają one długoterminowe przechowywanie materiałów cyfrowych.

Przykłady metadanych(SANS Securing The Human 2012, s. 1-2):"

  • data i czas utworzenia pliku;
  • adres lub położenie geograficzne miejsca utworzenia pliku;
  • imię i nazwisko, nazwa firmy, nazwa komputera lub adres IP;
  • nazwy wszystkich współtwórców dokumentu lub dodane komentarze;
  • typ użytego aparatu i jego ustawienia podczas robienia zdjęcia;
  • typ użytego urządzenia rejestrującego audio lub wideo i jego ustawienia podczas nagrywania;
  • marka, model i operator smartfona".

Wskaźniki określające jakość metadanych":

  • kompletność (ang. completeness) dotyczy zarówno ilości i rozkładu elementów metadanych w rekordach z punktu widzenia zawartości pojedynczych rekordów, jak i rozkładu danych w bazie danych (poziom semantyczny). Analiza kompletności określa stopień realizacji głównych funkcji metadanych w systemie, w tym głównie identyfikowalności opisywanego źródła.
  • poprawność (ang. correctness), która bywa traktowana synonimicznie z dokładnością (ang. accuracy), jest wskaźnikiem najtrudniejszym do oceny, przez co analizy oparte na tym wskaźniku nie poddają się automatyzacji (poziom pragmatyczny)." Przede wszystkim analizuje poprawność rekordów, wartości metadanych, pisownię (gramatyka, znaki specjalne bądź interpunkcję).
  • spójność obejmuje pojedyncze bazy danych oraz współpracujących bibliotek cyfrowych. "Można mówić o spójności pragmatycznej zapisu elementu danych, tworzonych linkach między zasobami powiązanymi relacjami, identyfikatorów i identyfikacji, prezentacji wyników wyszukiwania (wyświetlania metadanych) oraz syntaktyki metadanych".
  • analiza zdublowanych rekordów, które powstają w działaniach lokalnych oraz podczas wymiany/intergacji danych (M. Nahotko 2018, s. 13-14).

Zastosowanie metadanych:"

  • lokalizacje danych;
  • definicje danych związane z obsługiwanymi bazami danych i relacje;
  • przepływy danych i związane z nimi procesy ETL;
  • numery wersji metadanych oraz informacje o modyfikacjach;
  • statystyki użycia danych;
  • uprawnienia dostępu do danych" (M. Żytniewski 2004, s. 392-393).

Korzyści stosowania metadanych:

  • szybsze uzyskanie informacji na temat zbiorów danych, dostępnych dla interesującego nas obszaru,
  • łatwiejsze zarządzanie zasobami danych w obrębie organizacji,
  • możliwość lepszego zaplanowania działań dotyczących aktualizacji danych,
  • zwiększenie prawdopodobieństwa uniknięcia budowy zbiorów danych zgromadzonych już przez inne organizacje,
  • poszerzenie kręgu użytkowników danych

Metadane w Internecie

Tradycyjne metody katalogowania nie są jednak właściwe dla stron WWW, ze względu na szybki wzrost ilości danych, który po prostu uniemożliwia ich aktualne opracowanie.

Najczęściej stosowany format metadanch to Dublin Core Metadata Element Set (DC). Utworzony został dla dokumentów tekstowych w sieci jako cały system różnych działań obejmujących warsztaty szkoleniowe, publikacje, grupy dyskusyjne pracujące nad ułatwieniem w przeszukiwaniu zasobów elektronicznych. Dublin Core składa się z piętnastu elementów obejmujących trzy klasy:

  • I Zawartość: tytuł, opis, źródło, język, relacja, miejsce i czas
  • II Własność: twórca: współpraca, własność
  • III Dookreślenie: data, format, identyfikator

Informacja WWW odnajdywana jest przy pomocy wyszukiwarek, poprzez wpisanie odpowiedniego zapytania w formie słowa lub wyrażenia. Autor dokumentu internetowego wpisuje mtedane na początku kodu HTML. Wyszukiwarki stron porównują podane słowo lub wyrażenie z wpisywanymi metadanymi. W rezultacie otrzymujemy adresy internetowe, czyli tzw. linki dokumentów odpowiadających bądź też i nieodpowiadających, gdyż pomimo tego iż metadane porządkują sytuację, to często są używane do celów komercyjnych poprzez dodanie w tym miejscu jakiegokolwiek innego terminu.

Rys. 2. Przykład metadanych w internecie

<META NAME="DC.Title" CONTENT="Metadane">

<META NAME="DC.Subject" CONTENT="Metadane, Dublin Core, Google">

<META NAME="DC.Description" CONTENT="Podstawowe informacje">

<META NAME="DC.Publisher" CONTENT="PWN">

<META NAME="DC.Creator" CONTENT="Kowalski Jan">

Różnice pomiędzy katalogowaniem a tworzeniem metadanych według Gardmana:

  • są używane przy użyciu przeglądarek od, których zależy trafność wyszukania,
  • są często tworzone przez ludzi nieuprawnionych do tego,
  • Dotyczą specjalnego rodzaju dokumentów tzw. źródeł elektronicznych,
  • Są tworzone z myślą o specjalnej grupie użytkowników,
  • Istnieją różnice pomiędzy stosunkiem metadanych i źródłem elektronicznym a stosunkiem rekordu katalogowego a opisywaną książką.

Metadane w pozycjonowaniu stron

Znaczniki meta w częściach nagłówkowych stron od zawsze miały wpływ na pozycję w wynikach wyszukiwarek internetowych. Po uruchomieniu pierwszych wyszukiwarek internetowych, przez wiele lat ich odpowiednia definicja była działaniem dającycym satysfakcjonujące pozycje w rankingu wyników. W ostatnich latach ich znaczenie sukcesywnie maleje w obliczu rozwijających się algorytmów. Jest to spowodowane zwiększającą się liczbą czynników, które są analizowane oraz coraz sprawniejszym modyfikowaniem lub nawet tworzeniem ich na podstawie m.in. zawartości stron.

Meta tagi o największym wpływie na pozycjonowanie:

  • Tytuł strony
<title>Tytuł strony</title>

Znacznik ten ma zauważalny wpływ na pozycję serwisu w wynikach wyszukiwania. W przypadku niekonkurencyjnych fraz, odpowiednia jego definicja pozwala podwyższyć pozycję nawet do TOP 10 na interesujące nas słowo kluczowe. Jego atrakcyjność jest również ważnym czynnikiem zwiększającym częstotliwość klikalności strony w wynikach (ang. click through rate, CTR).

  • Opis strony
<meta name=”description” content=” Opis strony” />

Wpływ opisu strony ma znikomy wpływ na pozycję w wynikach, jednak pozwala na precyzyjne dopasowanie treści opisu, co przekłada się na wzrost klikalność wyniku. Tak jak w przypadku jego poprzednika – tytułu strony, jeśli jest on niezdefiniowany lub słabo dopasowany (wg algorytmu wyszukiwarki), zostanie wygenerowany automatycznie, niekoniecznie w sposób trafny oraz atrakcyjny dla użytkownika.

  • Słowa kluczowe
<meta name=”keywords” content=”Słowa kluczowe” />

Nie jest on już brany pod uwagę przy rankingowaniu stron przez Google, jednak wciąż ma znaczenie w niszowych, polskich wyszukiwarkach (Bing, Onet) oraz zagranicznych – np. Yandex.

  • Noindex / Nofollow
<meta name=”robots” content=”noindex, nofollow” />

Dyrektywa dla robotów indeksujących.

Noindex – Restrykcja indeksowania danej podstrony. W przypadku, gdy strona jest już w indeksie, po ponownej wizycie robota internetowego, zostanie ona wyindeksowana.

NoFollow – Informacja dla robota, aby nie podążał za linkami widniejącymi na danej podstronie.

Bibliografia



Autor: Magdalena Nowacka, Kasper Szymiczek, Kalina Świerat