HTML

Wikipedia definiert HTML (HyperText Markup Language) als...

...eine textbasierte Auszeichnungssprache zur Strukturierung elektronischer Dokumente wie Texte mit Hyperlinks, Bildern und anderen Inhalten. HTML-Dokumente sind die Grundlage des World Wide Web und werden von Webbrowsern dargestellt. (Wikipedia, 2023)

HTML hat im Forschungsdatenmanagement an zwei Stellen Bedeutung: Zum einen sind Web-Seiten Forschungsgegenstand und damit auch Forschungsdaten, vor allem in den Kultur- und Sozialwissenschaften. Zum anderen sind fast alle Forschungsdatenrepositorien Web-Dienste, die nicht nur nackte Daten, sondern auch HTML-Seiten ausgeben. Häufig haben Forschende die Möglichkeit, eine Beschreibung des Forschungsprojektes bzw. der Sammlung zu ergänzen. Dies geschieht nicht selten über Online-Formulare, die HTML akzeptieren. Beides sind gute Gründe, sich zumindest oberflächlich mit HTML zu befassen.

HTML folgt zwar nicht den strengen XML-Regeln, besitzt als Auszeichnungssprache aber doch Elemente, die durch Tags eingeleitet werden. Beispielsweise wird ein neuer Absatz durch <p> eingeleitet. p steht dabei für paragraph. Gutes HTML sollte aber möglichst auch ein End-Tag enthalten.

HTML ist zeichenkodiert, kein Containerformat. Nur einige wenige andere Formate können direkt in einer HTML-Datei mit enthalten sein, z.B. das Vektorgrafikformat SVG und MathML für mathematische Formeln. Für Rastergrafiken und andere nicht zeichenkodierte Objekte trifft das definitiv nicht zu. Solche Objekte müssen separat als Datei oder URL zugreifbar sein. Im HTML sind sie nur verlinkt. Über Dateinamen und eine sinnvolle Verzeichnisstruktur sollte man sich rechtzeitig Gedanken machen.