Modul: Text & Tabellen
XML (Extensible Markup Language)
Eine Markup Language (deutsch Auszeichnungssprache) ist eine maschinenlesbare Sprache für die Gliederung und Formatierung von Texten und anderen Daten (Wikipedia, 2024). Strukturelemente sind in Auszeichnungssprachen gekennzeichnet. Beispielsweise wird in den Textformaten HTML und TEI ein neuer Absatz mit dem Tag <p> eingeleitet. Das p steht dabei für "paragraph" oder "prose".
XML ist eine Auszeichnungssprache 2. Stufe in dem Sinne, dass XML anderen Auszeichnungssprachen einige grundsätzliche Regeln vorgibt. Beispielsweise fordert XML, dass es zu jedem Start-Tag ein End-Tag gibt. In TEI, das auf XML basiert, muss also nicht nur der Anfang eines Absatzes gekennzeichnet sein, sondern auch dessen Ende.
Das Konstruktionsprinzip ähnelt der Kennzeichnung von Siedlungen an überörtlichen Straßen. Beginn und Ende von Siedlungen werden durch Ortsschilder kenntlich gemacht (Tello, 2011).
Sogar die diagonale Durchstreichung im Siedlungsende-Schild hat eine Entsprechung in XML in Form des Schrägstrichs im End-Tag.
HTML, das nicht auf XML basiert, stellt es hingegen frei, schließende Tags zu verwenden. Manchmal geht dadurch die Eindeutigkeit der Textstruktur verloren. Web-Browser stellen HTML-Seiten ohne schließende Tags dann nach internen Regeln dar.
XML ist da also strenger. XML-basierte Auszeichnungssprachen werden auch XML-Dialekte genannt. Die Abbildung zeigt eine Auswahl.
XHTML ist eine strengere Form von HTML und kodiert wie HTML Web-Seiten. Es wird aber zugunsten von HTML 5 nicht weiterentwickelt und läuft daher aus. In MathML lassen sich mathematische Formeln schreiben. XML kann auch in Sprachen verwendet werden, die keinen Text kodieren. Ein Beispiel hierfür ist das Vektorgrafikformat SVG (Scalable Vector Graphics).