SEUME Erfurt – Ihr Dienstleister für das digitale Publizieren
DienstleistungenDaten • XML

XML

Begriff

XML (Kurzform für Extensible Markup Language) ist eine textbasierte Auszeichnungssprache für strukturierte Daten.

Die Daten werden dabei mit sogenannten Elementen im Text strukturiert.

Ein Element besteht hierbei aus einem Starttag <name>, dem Inhalt ... Text ... und einem abschließenden Endtag </name>.

Elemente, die nach Regelwerk keinen Textinhalt enthalten dürfen, werden mit einem Leertag <bild/> gekennzeichnet.

Elemente können hierarchisch strukturiert werden: <name> <vorname> ... Text ... </vorname> <nachname> ... Text ... </nachname> </name>.

Das Regelwerk (DTD)

Den „Bauplan“ bzw. das Regelwerk für ein XML-Dokument bezeichnet man DTD (Kurzform für Document Type Definition). Die DTD beschreibt (stark vereinfacht) die mögliche und/oder erforderliche Menge und Anordnung von Elementen in einem Dokument.

Die DTD ist ein Pflichtbestandteil von XML, es sei denn, dass mit dem Schalter standalone="yes" ein Dokument ohne Regelwerk definiert wurde.

Siehe auch DTD.

Weitere Eigenschaften

In XML werden die zu verwendenden Zeichen nur durch die Angabe der zu verwendenden Kodierung definiert.

Für die Definition und den Austausch von strukturierten Volltextdaten wird XML mit DTD eingesetzt, für den Austausch beliebiger Datenstrukturen oft XML ohne DTD.

Siehe auch SGML und SGML vs. XML.