Modul: Text & Tabellen

TEI

ToDo: Fehlersuche

Fehler in Forschungsdaten zu suchen ist Forschungsalltag und Teil des Forschungsdatenmanagements. Unterschieden werden wissenschaftliche und technische Qualitätssicherung. Die Überprüfung der wissenschaftlichen Korrektheit gehört zur wissenschaftlichen Qualitätssicherung. Bei der technischen Qualitätssicherung sollte mindestens auf

  • Gültigkeit (Einhaltung) des Daten- und Metadatenformats
  • Nicht erlaubte Werte bei Zahlen
  • Vollständigkeit der Daten und Metadaten

geprüft werden.

Info! Ein händische Prüfung ist oft mühsam, vielleicht sogar schon in der kleinen Übung unten. Für die Formatvalidierung wird daher üblicherweise Software eingesetzt. Das dürfen Sie hier und im Abschlussquiz auch tun. Es gibt mehrere Möglichkeiten:

  • XML-Editoren: Für die meisten muss eine Lizenz kostenpflichtig erworben werden. Installation oder Anmeldung erforderlich. Teils gewöhnungsbedürftig
  • TextGrid: Virtuelle Forschungsumgebung optimiert für XML/TEI mit Repositorium und zahlreichen Tools. Für Forschende der Geisteswissenschaften ist TextGrid daher weit mehr als "nur" ein XML-Editor. Anmeldung erforderlich. Client muss installiert werden. Bevor mit der Arbeit begonnen werden kann, muss ein "Projekt" erzeugt werden. Entgeltfrei. Ohne Werbung
  • Code Beautify arbeitet im Browser-Fenster. Keine Anmeldung und Installation erforderlich. Findet nicht jeden Fehler. Entgeltfrei. Werbung
  • Web-Browser: Einfach XML-Datei ins Browser-Fenster ziehen. Manche müssen auf Quellcode-Anzeige umgeschaltet werden. Finden nicht jeden Fehler
Für das professionelle Forschungsdatenmanagement sind die beiden letzten Produkte zwar nicht ausreichend, im Rahmen dieses Kurses können sie aber wertvolle Hinweise auf Fehler in der Wohlgeformtheit liefern. Einfach ausprobieren!
Hinweis: Bevor Sie das fehlerhafte Dokument untersuchen, sollten Sie sich einmal anschauen, wie das Werkzeug Ihrer Wahl gültiges XML anzeigt, denn alle genannten Werkzeuge können Tags "highlighten", d.h. farblich hervorheben. Nicht hervorgehobene Tags helfen sehr bei der Lokalisierung bzw. Eingrenzung von Fehlern. In diesem Kurs kann die Formatvalidierung aber auch ganz ohne Software durch aufmerksames Lesen erfolgen.



In der grauen Box befindet sich ein XML/TEI-Dokument mit zwei Fehlern, die das XML nicht wohlgeformt bzw. ungültig werden lassen.

<?xml version="1.0"?>
<!DOCTYPE tei SYSTEM "https://tei-c.org/release/xml/tei/custom/schema/dtd/tei_all.dtd">
<?xml-stylesheet type="text/xsl" href="file:///D:/tei/html/html.xsl?>
<TEI>
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title>Einfaches XML/TEI-Beispiel</title>
                <author>
                    <surname>Rathmann</surname>
                    <forename>Torsten</forename>
                </author>
            </titleStmt>
            <sourceDesc>
                <p>Born digital</p>
            </sourceDesc>
        </fileDesc>
    </teiHeader>
    <text>
        <body>
            <p>Als Auszeichnungssprache auf Basis von XML ist TEI Software- und Hardware-unabhängig.</p>
            <p>Da TEI nicht gepackt ist, ist es mit einem einfachen Texteditor, wie z.B. Notepad unter Windows, lesbar.</p>
        </body>
    </text>
</TEI>