Differenzierung von Daten

So verschieden wie die Forschungsgegenstände, Erkenntnisinteressen und Methoden in der Wissenschaft sind, so verschieden sind die Daten und die daraus gewonnenen Information, mit denen Wissenschaftlerinnen und Wissenschaftler arbeiten. Die Vielfalt der Perspektiven, aus denen man Daten je nach Struktur, Bearbeitungszustand oder Verwendungszweck betrachten kann, zeigt, dass die Begriffsbedeutung von 'Daten' kontextabhängig ist und immer wieder aufs Neue eingeordnet wird.

Wovon sprechen Menschen also, wenn sie von Daten sprechen?

Hier zeigen wir Ihnen eine kleine Übersicht über die Unterscheidungs- und Beschreibungsmerkmale von Daten, die sicherlich noch weiter ergänzt werden kann:

Unterscheidung nach klassischen Medientyp, z. B.:





Text-Daten Audio-Daten Bild-Daten Video-Daten


Unterscheidung nach Art und Herkunft, z. B.





Geo-Daten numerische Daten Sensor-Daten Mess-Daten


Unterscheidung nach physischer Form, z. B.:


analoge Daten digitale Daten

physische Speicherform


elektronische Speicherform


Unterscheidung nach Speicherformat, z. B.:

.txt
.docx
.pdf

.csv
.xlsx
.jpg
Textdateien Microsoft Word-Dokumente Portable Document Format
Comma-Separated Values Microsoft Excel-Dokumente Joint Photographic Experts Group







.svg
.png
.gif

.wav
.mp3
.flac
Scalable Vector Graphics
Portable Network Graphics Graphics Interchange Format
Waveform Audio File Format MPEG-1 Audio Layer 3 Free Lossless Audio Codec







.geojson
.gpx
.shapefile

.csv
.tsv
.json
Geospatial JavaScript Object Notation GPS Exchange Format Geodatenformat für Informationssysteme
Comma-Separated Values Tab-Separated Values JavaScript Object Notation 







.python
.html/css
.sql

.xml
.mets

Quellcode Python Quellcode für Webseiten Structured Query Language
Extensible Markup Language Metadata Encoding and Transmission Standard

Info! Die Datei-Formate legen fest, auf welche Art und Weise digitale Daten in Dokumenten organisiert, strukturiert und gespeichert werden.

Unterscheidung nach der Verwendungszusammenhang, z. B.:


Primärdaten Sekundärdaten

Daten, die direkt, an erster Stelle, gesammelt werden.


Daten, die bereits vorhandenen sind.



Unterscheidung nach Verarbeitungsstand, z. B.:



Rohdaten verarbeitete Daten aggregierte Daten
Unbearbeitete, im Originalzustand vorliegende Daten.



Daten, die durch Analyse, Bereinigung oder Transformation aus Rohdaten erstellt werde, wie z. B. eine tabellarische Aufbereitung.

Zusammengefasste oder gruppierte Daten zur Vereinfachung oder Übersichtlichkeit.




Unterscheidung nach Datentyp in der Programmierung, z. B.:




Integer (Ganzzahlen) Float (Fließkommazahlen) String (Zeichenkette) Boolean (Boolesche Werte)
repräsentiert ganze Zahlen, ohne Dezimalstellen Darstellung von Dezimalzahlen mit Nachkommastellen  repräsentieren Text oder Zeichenketten

Datentypen, die nur zwei mögliche Werte haben: Wahr (True) oder Falsch (False). 
Beispiele sind 1, -5 und 100. Beispielsweise:
3.76549034
Beispiele sind "Hallo, Welt!" oder auch "12345". Verwendung z. B. in bedingten Anweisungen und logischen Ausdrücken


Unterscheidung nach Verwendungszweck, z. B.:



Fach

Geschichte

Medizin

Maschinenbau

Datenbeschreibung

Archivdaten

Patientendaten

Konstruktionsdaten

Verwendungszweck


historische Netzwerkforschung und Dokumentation
             
medizinische Versorgung und Forschung


technische Planung und Entwicklung


Forschungsgegenstand



Historische Dokumente, Briefe,
Tagebücher
 

Medizinische Aufzeichnungen,
Laborergebnisse


Technische Zeichnungen,
Computer-Aided-Design-Modelle (CAD)


Medientyp

Text

Text und Zahlen

Grafiken und technische Notation

Datei-Format




Digitalisierte Papiervorlagen
(TIFF, JPEG2000) 



Elektronische Patientenakte (EPA)



AutoCAD-Zeichnungen (DWG)
Austauschformat für 3-D-Modelle (STEP)

Software



Archivverwaltungssoftware (z. B. AtoM), Texterkennungssoftware (OCR)

Software für Patientenakten (z. B. Epic),
medizinische Bildverarbeitungssoftware (z. B. OsiriX)


Software für technische Zeichnungen (z. B. AutoCAD) 
Software für CAD-Modellierung (z. B. SolidWorks)