Modul: Was sind Daten?
Differenzierung von Daten
So verschieden wie die Forschungsgegenstände, Erkenntnisinteressen und
Methoden in der Wissenschaft sind, so verschieden sind die Daten und die
daraus gewonnenen Information, mit denen Wissenschaftlerinnen und
Wissenschaftler arbeiten. Die Vielfalt der Perspektiven, aus denen man
Daten je nach Struktur, Bearbeitungszustand oder Verwendungszweck
betrachten kann, zeigt, dass die Begriffsbedeutung von 'Daten'
kontextabhängig ist und immer wieder aufs Neue eingeordnet wird.
Wovon sprechen Menschen also, wenn sie von Daten sprechen?
Hier zeigen wir Ihnen eine kleine Übersicht über die Unterscheidungs- und Beschreibungsmerkmale von Daten, die sicherlich noch weiter ergänzt werden kann:
Unterscheidung nach klassischen Medientyp, z. B.:
Text-Daten | Audio-Daten | Bild-Daten | Video-Daten |
Unterscheidung nach Art und Herkunft, z. B.
Geo-Daten | numerische Daten | Sensor-Daten | Mess-Daten |
Unterscheidung nach physischer Form, z. B.:
Unterscheidung nach physischer Form, z. B.:
analoge Daten | digitale Daten |
physische
Speicherform |
elektronische Speicherform |
Unterscheidung nach Speicherformat, z. B.:
.txt |
.docx |
.pdf |
.csv |
.xlsx |
.jpg |
|
Textdateien | Microsoft Word-Dokumente | Portable Document Format | Comma-Separated Values | Microsoft Excel-Dokumente | Joint
Photographic Experts Group |
|
.svg |
.png |
.gif |
.wav |
.mp3 |
.flac |
|
Scalable Vector Graphics |
Portable Network Graphics | Graphics Interchange Format | Waveform Audio File Format | MPEG-1 Audio Layer 3 | Free Lossless Audio Codec | |
.geojson |
.gpx |
.shapefile |
.csv |
.tsv |
.json |
|
Geospatial JavaScript Object Notation | GPS Exchange Format | Geodatenformat für Informationssysteme | Comma-Separated Values | Tab-Separated Values | JavaScript Object Notation | |
.python |
.html/css |
.sql |
.xml |
.mets |
||
Quellcode Python | Quellcode für Webseiten | Structured Query Language | Extensible Markup Language | Metadata Encoding and Transmission Standard |
Info! Die Datei-Formate legen fest, auf welche Art und Weise digitale Daten in Dokumenten organisiert, strukturiert und gespeichert werden.
Unterscheidung nach der Verwendungszusammenhang, z. B.:
Primärdaten | Sekundärdaten |
Daten, die direkt, an erster Stelle, gesammelt werden. |
Daten, die bereits vorhandenen sind. |
Unterscheidung nach Verarbeitungsstand, z. B.:
Rohdaten | verarbeitete Daten | aggregierte Daten |
Unbearbeitete,
im Originalzustand vorliegende Daten. |
Daten, die durch Analyse, Bereinigung
oder Transformation aus Rohdaten erstellt werde, wie z. B. eine tabellarische Aufbereitung. |
Zusammengefasste oder gruppierte
Daten zur Vereinfachung oder Übersichtlichkeit. |
Unterscheidung nach Datentyp in der Programmierung, z. B.:
Integer (Ganzzahlen) | Float (Fließkommazahlen) | String (Zeichenkette) | Boolean (Boolesche Werte) |
repräsentiert ganze Zahlen, ohne Dezimalstellen | Darstellung von Dezimalzahlen mit Nachkommastellen | repräsentieren Text oder
Zeichenketten |
Datentypen, die nur zwei mögliche Werte haben: Wahr (True) oder Falsch (False). |
Beispiele sind 1, -5 und 100. | Beispielsweise: 3.76549034 |
Beispiele sind "Hallo, Welt!" oder auch "12345". | Verwendung z. B. in bedingten Anweisungen und logischen Ausdrücken |
Unterscheidung nach Verwendungszweck, z. B.:
|
|||
Fach |
Geschichte |
Medizin |
Maschinenbau |
Datenbeschreibung |
Archivdaten |
Patientendaten |
Konstruktionsdaten |
Verwendungszweck |
historische Netzwerkforschung und Dokumentation |
medizinische Versorgung und
Forschung |
technische Planung und
Entwicklung |
Forschungsgegenstand |
Historische Dokumente, Briefe,
Tagebücher |
Medizinische Aufzeichnungen,
Laborergebnisse |
Technische Zeichnungen,
Computer-Aided-Design-Modelle (CAD) |
Medientyp |
Text |
Text und Zahlen |
Grafiken und technische Notation |
Datei-Format |
Digitalisierte Papiervorlagen (TIFF, JPEG2000) |
Elektronische Patientenakte
(EPA) |
AutoCAD-Zeichnungen (DWG) Austauschformat für 3-D-Modelle (STEP) |
Software |
Archivverwaltungssoftware (z. B.
AtoM), Texterkennungssoftware (OCR) |
Software für Patientenakten (z. B. Epic),
medizinische Bildverarbeitungssoftware (z. B. OsiriX) |
Software für technische Zeichnungen (z. B. AutoCAD) Software für CAD-Modellierung (z. B. SolidWorks) |