Bei XML (Extensible Markup Language) handelt es sich um eine deklarative Metasprache, die die Basis für eine Vielzahl unterschiedlicher Dateiformate darstellt. Das bekannteste Datenformat, das auf XML basiert, ist HTML (Hypertext Markup Language), das bei der Erstellung von Websites im World Wide Web zum Einsatz kommt. Die Speicherung der Daten erfolgt bei XML-Dokumenten auf strukturierter Basis, sodass die Daten sowohl für Maschine als auch für den Menschen gut lesbar sind. Das Anwendungsspektrum ist sehr vielfältig.

Ursprung und Entwicklungsgeschichte von XML

Das Kürzel XML steht für Extensible Markup Language, was in die deutsche Sprache übersetzt so viel bedeutet wie erweiterbare Auszeichnungssprache. Sie ist eine vereinfachte Neudefinition, stellt aber auch eine Implementierung der Standard Generalized Markup Language SGML dar. XML eignet sich als Metasprache hervorragend, um als Basis für neue Sprachen genutzt zu werden. Das bekannteste Beispiel hierfür ist HTML, die Hypertext Markup Language, die in Form des HTML5-Standards als Grundstein aller Websites im World Wide Web zum Einsatz kommt. Das World Wide Web Consortium (W3C), das für die Entwicklung und Implementierung offener Web-Standards zuständig ist, wollte, dass XML unter dem Namen XHTML die Hypertext Markup Language als Sprache des modernen Internets ersetzt. Dieses Vorhaben konnte jedoch aufgrund starker Diskrepanzen zwischen W3C und den tatsächlichen Bedürfnissen der Industrie nicht realisiert werden und führte zu der Entwicklung einer neuen standardisierten Websprache, die heute besser bekannt ist unter der Bezeichnung HTML5. Obwohl XML dadurch an Bedeutung verlor und seinen eigentlichen Zweck nicht mehr erfüllt, spielt die Extensible Markup Language in vielen anderen Bereichen eine äußerst bedeutende Rolle.

Aufbau

Ein wesentlicher Teil der Sprachdefinition der Extensible Markup Language wurde direkt aus der Standard Generalized Markup Language übernommen, die nach ISO 8879 standardisiert ist. XML erbte als einflussreichstes Konzept von SGML die explizite Trennung von physischen und logischen Einheiten, also von Inhalt und Struktur. Dieses Konzept setzt sich mit der Aufteilung in HTML und CSS (Cascading Style Sheets) fort und bildet die Basis für die Darstellung von Webseiten mit unterschiedlichen Designvorlagen, wie es beispielsweise im Rahmen des Responsive Designs der Fall ist. Die Vielseitigkeit und Flexibilität von SGML und XML basiert in erster Linie auf den Syntaxelementen, die von dem Nutzer nach individuellen Anforderungen und Bedürfnissen spezifiziert werden können, und auf der Option, diese Elemente in sogenannten „Schemata“ zu speichern. Dabei wird die Struktur eines XML-Dokuments von einem XML-Schema explizit definiert, wodurch auch eine formale Sprache vorgegeben wird.

Mehr zum Thema:
Was ist eigentlich... Hardware?

Struktur von XML-Dokumenten

Ein XML-Dokument setzt sich grundsätzlich aus verschiedenen Textauszeichnungen (Markup) und Inhalt zusammen. Auszeichnungen, die von spitzen Klammern eingeschlossen sind, werden als „Tags“ bezeichnet. Sie treten in der Regel als Paare auf und schließen den Textinhalt ein. Es gibt öffnende und schließende Tags und, die mit dem eingeschlossenen Text ein sogenanntes XML-Element bilden. Inhaltslose Elemente setzen sich in der Regel nur aus einem einzelnen Tag zusammen. Ein prominentes Beispiel hierfür ist das Zeilenumbruch-Element: [br/]. Hier kann man deutlich erkennen, dass bei Elementen ohne Inhalt am Ende des schließenden Tags ein Schrägstrich steht. Dieser Schrägstrich steht auch bei Elementen mit Inhalt, und zwar am Anfang der schließenden spitzen Klammer, wie beispielsweise bei dem Paragraf-Element: [br] Das ist ein Paragraf [/br].

Der zweite bedeutende Baustein der Extensible Markup Language sind die sogenannten „Attribute“. Bei diesen elementaren Sprachbausteinen handelt es sich um Namens-Wert-Paare, die in öffnenden oder inhaltslosen Tags stehen können. Ein bekanntes Beispiel für den Einsatz von Attributen ist die Angabe der Dateinamen für Bilder. Diese werden mit dem Image-Tag auf folgende Weise eingefügt: [img src=“bild_datei.jpg“] Das ist ein Image-Attribut [/img].

In welchen Bereichen wird XML eingesetzt?

XML eignet sich aufgrund ihrer besonderen Eigenschaften als Metasprache für ein breites Spektrum an unterschiedlichen Einsatzszenarien. Der typische Einsatz ist im World Wide Web, denn Websites sind nichts anderes als Dokumente, die von Webservern bereitgestellt werden. Die Anwendungsbereiche von XML reichen vom Einsatz als Konfigurationsdateien in diversen Software-Tools, wie beispielsweise Apache Maven, über Sprachdefinitionen, die bei der Erstellung druckbarer Textdokumente verwendet werden, bis hin zu dem vektoriellen Bildformat-Standard SVG (Scalable Vector Graphics). Besonders bekannte Beispiele für den Einsatz von XML sind:

– DocBook

Apache Maven

– Grafische Benutzerschnittstellen wie XUL oder Glade

– die Keyhole Markup Language (KML), die in erster Linie bei der Annotierung digitaler Kartendienste wie Google Maps zum Einsatz kommt

Die Extensible Markup Language ist eine äußerst flexible Metasprache, die heutzutage in zahlreichen Anwendungsbereichen zum Einsatz kommt.

Letzte Artikel von Daniel Faust (Alle anzeigen)