Modul: Text & Tabellen

Tabellendokumente

Neben Grafik und Text sind Tabellen, die mit Tabellenkalkulationsprogrammen wie z.B. Microsoft Excel erzeugt werden, wichtige Datenarten. Solche Tabellen werden in der Forschung häufig verwendet. Sie gehören in der Regel zu den Forschungsdaten, die im Rahmen der guten wissenschaftlichen Praxis mindestens 10 Jahre aufgehoben werden müssen. Das Video oder der nachfolgende Text geben Informationen zu Tabellendaten.

  

Unter den Tabellenkalkulationsprogrammen ist Microsoft Excel am verbreitetsten. Excel speichert Tabellen standardmäßig als .xlsx, das die tabellenkalkulationsspezifische Seite des Büroanwendungsformats OOXML ist. Ein Nachteil dabei ist, dass OOXML als Container-Format nicht zeichenkodiert und deshalb nur mit Software-Hilfe lesbar ist, sodass eine geeignete Software erhalten bleiben muss. Im Kern handelt es sich um das gleiche OOXML-Problem wie bei .docx auch: Der Container ist in der Lage, außer Tabellen auch andere Bestandteile wie Rastergrafiken aufzunehmen, deren Formate veralten können und dann nicht mehr lesbar sind.

Außerdem wurde .xlsx von Microsoft auf die spezielle Arbeitsweise von Excel zugeschnitten. Zwar können andere Tabellenkalkulationsprogramme .xlsx in der Regel auch lesen und schreiben, aber in der Interpretation der Details kann es Unterschiede geben. Daher bewertet die Informationsplattform „forschungsdaten.info“ .xlsx zwar als geeignet für die Speicherung im Rahmen der guten wissenschaftlichen Praxis, aber nicht für die Langzeitspeicherung über mehr als zehn Jahre hinaus.

Jedoch gibt es noch andere Formate, in denen Tabellen gespeichert werden können. Das Format Comma Separated Value, abgekürzt CSV, ist ein reines Textformat und als solches mit jedem Texteditor lesbar. Da es zudem weit verbreitet und langzeitstabil ist, ist es für die Langzeitarchivierung besonders gut geeignet. (Universität Konstanz, o.J.e)

Zum Aufbau:

  • Eine Zeile in der Tabelle ist eine Zeile in CSV.
  • Die Spalten innerhalb einer Zeile sind durch Separatoren (Trennsymbole) voneinander getrennt. Anders als der Name „Comma Separated Value“ suggeriert, muss das nicht zwangsläufig ein Komma sein. Voreinstellung ist meist ein Semikolon. Praxistipp: Wird stattdessen ein Tabulatorzeichen verwendet, stehen die Spalteneinträge geordnet untereinander, sofern die Einträge nicht sehr lang sind.
Die Grafik stellt die Ansicht in der grafischen Oberfläche des Tabellenkalkulationsprogramms dem Dateiformat CSV gegenüber Grafische Oberfläche des Tabellenkalkulationsprogramms A B C 1 x y 2 1 3 3 1,5 3,5 4 1 4 Export nach CSV Comma Separated Value (CSV) x;y 1;3 1,5;3,5 1;4

Hervorhebungen durch Farbe, Font, Kursivdruck, etc. gehen beim Export verloren. Wenn die Hervorhebungen mitgespeichert werden sollen, müssen sie in eine zusätzliche Spalte geschrieben und die so erweiterte Tabelle gespeichert werden. Im Video ist ein Beispiel gezeigt. Ebenfalls nicht mitkonvertiert werden Grafiken und Diagramme, die ebenfalls in XLSX enthalten sein können. Diese müssten gesondert als Grafiken gespeichert werden. Ansonsten schadet es nicht, zur CSV-Datei und den Grafiken die .xlsx-Datei einfach mit dazuzulegen.