SEUME Erfurt – Ihr Dienstleister für das digitale Publizieren
DienstleistungenDaten • SGML

SGML

Begriff

SGML (Kurzform für Standard Generalized Markup Language) ist eine Vorschrift zur Erstellung und Anwendung von textbasierten Auszeichnungssprachen.

Bekannt geworden ist SGML durch die „Reference Concrete Syntax“, eine Auszeichnungssprache, deren Syntaxbestandteile beispielsweise die Zeichen < / > & und ; sind, aus denen sich Elemente <element> oder Entitäten &auml; formen lassen. Die bekannteste Anwendung von SGML ist HTML (die ursprüngliche Fassung, im heutigen HTML sind aber Erkennungszeichen von SGML noch deutlich sichtbar).

Im Sprachgebrauch hat sich SGML als Begriff für diese Form der Auszeichnung etabliert.

Die Daten werden dabei mit sogenannten Elementen im Text strukturiert.

Ein Element besteht hierbei aus einem Starttag <name>, dem Inhalt ... Text ... und einem abschließenden Endtag </name>.

Elemente, die nach Regelwerk keinen Textinhalt enthalten dürfen, werden ohne schließenden Tag <bild> gekennzeichnet.

Elemente können hierarchisch strukturiert werden: <name> <vorname> ... Text ... </vorname> <nachname> ... Text ... </nachname> </name>.

Das Regelwerk (DTD)

Den „Bauplan“ bzw. das Regelwerk für ein SGML-Dokument bezeichnet man DTD (Kurzform für Document Type Definition). Die DTD beschreibt (stark vereinfacht) die mögliche und/oder erforderliche Menge und Anordnung von Elementen in einem Dokument.

Die DTD ist stets ein Pflichtbestandteil von SGML.

Siehe auch DTD.

Das Erkennungszeichen für SGML

Ein Erkennungszeichen von SGML ist das nicht besonders gekennzeichnete Leerelement wie auch das syntaktische Verkürzungen von unnötigen Tags, bekannt aus altem wie auch aus hochmodernem HTML. Dabei werden Metadaten oder Bilder nur noch in der Form <img> gekennzeichnet. Bei Absätzen und Listen kann beispielsweise auf den schließenden Tag verzichtet werden <ul><li> ... <li> ... <li> ... </ul>.

Weitere Eigenschaften

In SGML müssen alle zu verwendenden Zeichen exakt definiert werden.

SGML wurde für die Definition, den Austausch und die Archivierung von strukturierten Volltextdaten entwickelt.

Siehe auch XML und SGML vs. XML.