Modul: Text & Tabellen

XML (Extensible Markup Language)

Eine Markup Language (deutsch Auszeichnungssprache) ist eine maschinenlesbare Sprache für die Gliederung und Formatierung von Texten und anderen Daten (Wikipedia, 2024). Strukturelemente sind in Auszeichnungssprachen gekennzeichnet. Beispielsweise wird in den Textformaten HTML und TEI ein neuer Absatz mit dem Tag <p> eingeleitet. Das p steht dabei für "paragraph" oder "prose".

XML ist eine Auszeichnungssprache 2. Stufe in dem Sinne, dass XML anderen Auszeichnungssprachen einige grundsätzliche Regeln vorgibt. Beispielsweise fordert XML, dass es zu jedem Start-Tag ein End-Tag gibt. In TEI, das auf XML basiert, muss also nicht nur der Anfang eines Absatzes gekennzeichnet sein, sondern auch dessen Ende.

Start-Tags bestehen in der hier gezeigten einfachsten Form aus Spitzklammer auf, Elementname und Spitzklammer zu. Zwischen Start-Tag und End-Tag steht der Textinhalt. <p>Dies ist ein Absatz.</p> Markierung Absatz: Start-Tag End-Tag (Pflicht in XML)

Das Konstruktionsprinzip ähnelt der Kennzeichnung von Siedlungen an überörtlichen Straßen. Beginn und Ende von Siedlungen werden durch Ortsschilder kenntlich gemacht (Tello, 2011).

Ortsanfang-Straßenschild Wuppertal Ortsende-Straßenschild Wuppertal

Sogar die diagonale Durchstreichung im Siedlungsende-Schild hat eine Entsprechung in XML in Form des Schrägstrichs im End-Tag.

HTML, das nicht auf XML basiert, stellt es hingegen frei, schließende Tags zu verwenden. Manchmal geht dadurch die Eindeutigkeit der Textstruktur verloren. Web-Browser stellen HTML-Seiten ohne schließende Tags dann nach internen Regeln dar.

XML ist da also strenger. XML-basierte Auszeichnungssprachen werden auch XML-Dialekte genannt. Die Abbildung zeigt eine Auswahl.

Oben steht XML als Auszeichnungssprache 2. Stufe, darunter die XML-Dialekte, wie z.B. SVG XML TEI DOCX ODT XHTML MathML SVG gibt grundlegende Regeln vor XML-Dialekte

XHTML ist eine strengere Form von HTML und kodiert wie HTML Web-Seiten. Es wird aber zugunsten von HTML 5 nicht weiterentwickelt und läuft daher aus. In MathML lassen sich mathematische Formeln schreiben. XML kann auch in Sprachen verwendet werden, die keinen Text kodieren. Ein Beispiel hierfür ist das Vektorgrafikformat SVG (Scalable Vector Graphics).