XML
XML (ang. eXtensible Markup Language) - rozszerzalny język znaczników. Stanowi on uproszczoną wersję języka SGML, a dokładniej jego podzbiór. XML jest metajęzykiem służącym do definiowania innych języków. Jest to język znaczników, w którym nie sprecyzowano ani zestawu znaczników, ani gramatyki języka. Ma więc nieograniczone możliwości rozbudowy, jest rozszerzalny - stąd jego nazwa (Sokół, 2002, s. 7). Pozycja XML wydaje się być nie zagrożona. Jest czytelnym formatem, stanowiącym element modnej technologii. Jest podstawą dla wielu innych rozwijanych technologii. Istnieje możliwość, że przyszłości wyprze język HTML dla WEB, oraz stanie się najważniejszym formatem dla EDI (wymiany danych).
TL;DR
XML to rozszerzalny język znaczników, który powstał na bazie języka SGML. XML jest podstawą do tworzenia wielu innych języków, takich jak XHTML czy MathML. Poprawny dokument XML musi spełniać określone zasady składni i struktury. XML znajduje zastosowanie w produkcji stron internetowych, EDI, e-commerce i wielu innych dziedzinach. W przyszłości może być wykorzystywany do tworzenia nowych standardów i wspierania baz danych.
Historia
Język XML powstał na bazie języka SGML (Standard Generalized Markup Language). SGML został stworzony w latach sześćdziesiątych XX wieku przez Charlesa Goldfarba, Eda Moshera i Raya Lorie pracujących w laboratoriach IBM. Jest to uogólniony język znaczników służący do ujednolicania struktury i formatu różnego typu informacji, jednak jego złożoność nie pozwoliła na szersze zastosowania. Bardzo popularnym stał się natomiast język HTML, będący aplikacją SGML. W 1995 roku Don Connolly dołączywszy do kadry World Wide Web Consortium (W3C), wprowadził SGML do listy działalności W3C. Powołana została grupa składająca się z 11 członków, którzy rozpoczęli prace nad uproszczoną wersją języka SGML. Wynikiem ich prac była pierwsza wersja robocza języka XML opublikowana 14 listopada 1996 roku. Po dwóch latach pracy, 10 lutego 1998 roku W3C zarekomendowała XML w wersji 1.0.
XML stał się podstawą do stworzenia różnego rodzaju języków, takich jak:
- ODF (OASIS Open Document Format for Office Applications) - format zapisu dokumentów biurowych,
- SVG (Scalable Vector Graphics) - format grafiki wektorowej,
- MathML (Mathematical Markup Language) - opis formuł matematycznych,
- XHTML (Extensible HyperText Markup Language) - język służący do tworzenia stron WWW,
- XUL (XML-based User-interface Language) - język używany do opisu interfejsu użytkownika
i wielu innych.
Skład dokumentu XML
Przykład prostego wykorzystania języka XML:
<source lang="xml"> <?xml version="1.0" encoding="iso-8859-2"?> <dokument> <pozdrowienia> Witaj czytelniku!! </pozdrowienia> </dokument> </source>
Pierwszym elementem każdego dokumentu XML jest instrukcja przetwarzania <?xml version="1.0" encoding="iso-8859-2"?>. Określa ona rodzaj używanej wersji XML-a, arkusz stylów, język kodowania lub inne informacje potrzebne do poprawnego przetworzenia danych XML (McLaughlin, 2001, s. 47).
Po tej instrukcji przetwarzania pojawia się nowy znacznik <dokument>, który jest elementem głównym, najwyższym w hierarchii elementem dokumentu XML. Znacznik ten, w połączeniu z odpowiadającym mu znacznikiem zamykającym, otacza całą pozostałą zawartość dokumentu XML. Można używać dowolnej nazwy znacznika, byle tylko zaczynała się od litery lub podkreślenia i dalej zawierała jedynie litery, cyfry, podkreślenia, kropki i myślniki. Znaczniki XML zawsze zaczynają się znakiem mniejszości i kończą znakiem większości (Holzner, 2001, s. 4).
Kolejny znacznik <pozdrowienia> jest podrzędnym elementem zawierającym treść tekstową Witaj czytelniku!! . Oba elementy mogą zawierać różne dane, trzeba jednak przestrzegać kilku zasad:
- nazwa elementu musi rozpoczynać się literą lub podkreśleniem, po którym może wystąpić dowolna liczba liter, cyfr, podkreśleń, łączników lub kropek, nazwy nie mogą zawierać spacji,
- w nazwach elementów XML rozróżniana jest wielkość liter,
- każdy otwarty element musi zostać zamknięty (McLaughlin, 2001, s. 49).
Poprawność dokumentu XML
Dokument ma poprawną składnię (well-formed) pod warunkiem spełnienia ogólnych zasad XML.
Dokument ma poprawną strukturę (valid) gdy jest zgody z dodatkowymi schematami. Do tworzenia schematów najbardziej popularnymi językami są RELAX NG, XML Schema oraz DTD.
Dokument o poprawnej składni jest tworzony w oparciu o zasady
1. Zawiera deklarację XML, która jest zawsze umieszczona na początku pliku i opisuje atrybut version (version przyjmuje wartości 1.0 i 1.1). Dodatkowo opcjonalne są atrybuty:
- Encoding, opisujący stronę kodową dokumentu. Wartość domyślna to UTF-8 (Unicode). W Encoding deklarowany jest zbiór znaków używanych w dokumencie.
- Standalone, stanowi o trybie dokumentu XML, przyjmuje wartość YES oraz NO. YES oznacza, że dokument nie zawiera innych plików wymagających przetworzenia razem z dokumentem jak zewnętrzne arkusze albo definicje DTD.
2. Wszystkie elementy muszą rozpoczynać się znacznikiem początku elementu, jak również kończyć takim samym znacznikiem końca elementu. Elementy puste, nie zawierające danych stanowią wyjątek i nie muszą zawierać znaczników.
3. Nazwy elementów nie mogą być rozpoczęte przez znak łącznika (-), kropkę lub cyfrę.
4. Możliwe jest zagnieżdżanie elementów. Element podrzędny nazywany jest dzieckiem (child), a element nadrzędny rodzicem (parent).
5. Format XML nie może przyjmować niektórych znaków gdyż mogą być interpretowane jako znaczniki i powodując błędne interpretacje. Np. znak mniejszości "<" zostanie przeczytany przez parser XML jako początek znacznika. Do takich znaków również należy ampersand "&".
Jeśli potrzebujemy użyć znaków należy je odpowiedni zakodować. Dla "<" będzie to zapis <, dla "&" &
6. Dokument XML pozwala na wprowadzanie komentarzy. Wpis poprzedza .
W celu przeniesienia do aplikacji instrukcji przetwarzania poprzedza się ją znakami <?, a kończy ?>.
Zastosowania XML
Wybrane zastosowania XML:
- Produkcja stron internetowych.
- Prezentacja danych semistrukturalnych.
- Multimedia.
- EDI (Electronic Data Interchange) Elektroniczna wymiana dokumentów.
- E-commerce (sprzedaż internetowa).
- Pliki konfiguracyjne oprogramowania.
Przyszłość XML
Język XML w przyszłości może znaleźć zastosowania w:
- Tworzeniu nowych standardów takich jak np. XQuery.
- Wsparciu dla baz danych.
- Tworzeniu nowych zastosowań w systemach biurowych, XHTML.
XML — artykuły polecane |
HTML — SmallTalk (język programowania) — Cobol — Baza NoSQL — Litecoin — BASIC — Pascal (język programowania) — UML — Przeglądarka internetowa |
Bibliografia
- Holzner S. (2001), XML. Vademecum profesjonalisty, Helion, Gliwice
- Howard K. (2014). Szybki start, Wydawnictwo Helion, Gliwice. Wydanie II
- Kozienko P., Gwiazda K. (2012), XML na poważnie,, Wydawnictwo Helion, Warszawa
- McLaughlin B. (2001), Java i XML, Wydawnictwo Helion, Gliwice
- Ogrodniczuk M. (2011), XML i nowoczesne metody zarządzania treścią, Wydanie MIMUW, 5 grudnia
- Roszkowski M. (2017), Reprezentacja metadanych bibliograficznych w środowisku sieciowym, Instytut Informacji Naukowej i Studiów Bibliologicznych
- Sokół M. (2002), ABC języka HTML, Wydawnictwo Helion, Gliwice
- Traczyk T. (2005), Język XQuery jako narzędzie do integracji danych - Oracle XML Data Synthesis
- Traczyk T. (2015), Wprowadzenie do XML
- Wrembel R., Królikowski Z., Morzy M. (2017), Magazyny danych - stan obecny i kierunki rozwoju, Wydawnictwo NAKOM, Poznań
Autor: Bartłomiej Maruszak, Grzegorz Jaworek