Modul: Was sind Daten?

Website: ORCA.nrw
Kurs: Grundwissen: Datenmanagement in Studium & wissenschaftlicher Praxis
Buch: Modul: Was sind Daten?
Gedruckt von: Gast
Datum: Freitag, 22. November 2024, 15:01

Über dieses Modul


Hier erfahren Sie etwas über die Unterscheidung von ‚Daten‘, ‚Information‘ und ‚Wissen‘, Näheres über die begriffliche Rahmung von ‚Daten‘ und Sie erhalten eine Definition von Forschungsdaten.

  • Wissenspyramide
  • Daten in der Forschung


Lernziel (Verstehen): Die Studentinnen und Studenten können die Unterscheidung von Daten, Information und Wissen anhand der Wissenspyramide darstellen.
Lernziel
(Wissen): Die Studentinnen und Studenten kennen eine Definition von Forschungsdaten.

Bearbeitungsdauer: ≈ 35 Min.

Wissenspyramide

Kennen Sie die Wissenspyramide? Sie ist eine weit verbreitetes und gängiges Konzept, das modellhaft den Prozess der Wissensentstehung verdeutlicht, indem sie die drei zentralen Begriffe — Daten, Information und Wissen — hierarchisch ordnet und idealtypisch voneinander abgrenzt.

Ordnen Sie die Begriffe (fett gesetzter Text) und Erläuterungen (kursiv gesetzter Text] per Drag-and-Drop zu und klicken auf 'Überprüfen'. Wiederholen Sie Ihre Eingabe bei Bedarf.



Erläuterung der Ebenen

Die Wissenspyramide ist ein geläufiges Konzept zur Veranschaulichung des Prozesses der Informationsverarbeitung. Sie findet insbesondere in der Informatik sowie im Daten- und Wissensmanagement breite Anwendung.


Es existieren verschiedene Darstellungen der Wissenspyramide. Einige schließen eine oberste Ebene namens 'Weisheit' mit ein, die jedoch in der Praxis schwer greifbar ist, da sie subjektiv und schwer zu quantifizieren ist. Andere Modelle, ergänzen unterhalb der Ebene der Daten eine Zeichenebene, um die Bedeutung der Syntax verschiedner Schrift- und Symbolsystemen zu betonen.

ToDo: Recherche


Recherchieren Sie im Netz nach der Wissenspyramide und finden Sie Näheres über dieses Konzept zur Unterscheidung von Daten, Information und Wissen heraus, um sich weiter mit dem Thema vertraut zu machen.


  • Können Sie einen Bezug zu den Inhalten Ihres fachwissenschaftlichen Studiums herstellen:
    • Welche Daten werden in Ihrem Fach erhoben oder genutzt?
    • Welche Information wird hieraus hergestellt?
    • Welches Wissen wird generiert?
  • Welche Methoden kommen in Ihrer Fachdisziplin zum Einsatz, um Daten zu erheben und Information herzustellen?


Teilen Sie Ihre Gedanken, Ideen und gefundenen Quellen im Notizpad zu dieser Lerneinheit.

Beispiel Matrikelnummer

Ein einfaches Beispiel für ein Datum ist z. B. die Matrikelnummer für Studierende. Jede und Jeder von Ihnen hat bei der Einschreibung an der Universität eine eindeutige, einmalig vergebene Matrikelnummer erhalten. Wie die Studien- und Prüfungsverwaltung anhand der Verschlüsselung über die Matrikelnummer Wissen über Sie generiert und in welchem Verhältnis Daten, Information und Wissen dabei zueinander stehen, zeigen wir Ihnen hier beispielhaft.


Beispiel Interview

Wie sich die Zuordnung von Daten, Information und Wissen im Forschungsprozess eines Interviews darstellt, zeigen wir Ihnen hier an einem weiteren Beispiel. 


Differenzierung von Daten

So verschieden wie die Forschungsgegenstände, Erkenntnisinteressen und Methoden in der Wissenschaft sind, so verschieden sind die Daten und die daraus gewonnenen Information, mit denen Wissenschaftlerinnen und Wissenschaftler arbeiten. Die Vielfalt der Perspektiven, aus denen man Daten je nach Struktur, Bearbeitungszustand oder Verwendungszweck betrachten kann, zeigt, dass die Begriffsbedeutung von 'Daten' kontextabhängig ist und immer wieder aufs Neue eingeordnet wird.

Wovon sprechen Menschen also, wenn sie von Daten sprechen?

Hier zeigen wir Ihnen eine kleine Übersicht über die Unterscheidungs- und Beschreibungsmerkmale von Daten, die sicherlich noch weiter ergänzt werden kann:

Unterscheidung nach klassischen Medientyp, z. B.:





Text-Daten Audio-Daten Bild-Daten Video-Daten


Unterscheidung nach Art und Herkunft, z. B.





Geo-Daten numerische Daten Sensor-Daten Mess-Daten


Unterscheidung nach physischer Form, z. B.:


analoge Daten digitale Daten

physische Speicherform


elektronische Speicherform


Unterscheidung nach Speicherformat, z. B.:

.txt
.docx
.pdf

.csv
.xlsx
.jpg
Textdateien Microsoft Word-Dokumente Portable Document Format
Comma-Separated Values Microsoft Excel-Dokumente Joint Photographic Experts Group







.svg
.png
.gif

.wav
.mp3
.flac
Scalable Vector Graphics
Portable Network Graphics Graphics Interchange Format
Waveform Audio File Format MPEG-1 Audio Layer 3 Free Lossless Audio Codec







.geojson
.gpx
.shapefile

.csv
.tsv
.json
Geospatial JavaScript Object Notation GPS Exchange Format Geodatenformat für Informationssysteme
Comma-Separated Values Tab-Separated Values JavaScript Object Notation 







.python
.html/css
.sql

.xml
.mets

Quellcode Python Quellcode für Webseiten Structured Query Language
Extensible Markup Language Metadata Encoding and Transmission Standard

Info! Die Datei-Formate legen fest, auf welche Art und Weise digitale Daten in Dokumenten organisiert, strukturiert und gespeichert werden.

Unterscheidung nach der Verwendungszusammenhang, z. B.:


Primärdaten Sekundärdaten

Daten, die direkt, an erster Stelle, gesammelt werden.


Daten, die bereits vorhandenen sind.



Unterscheidung nach Verarbeitungsstand, z. B.:



Rohdaten verarbeitete Daten aggregierte Daten
Unbearbeitete, im Originalzustand vorliegende Daten.



Daten, die durch Analyse, Bereinigung oder Transformation aus Rohdaten erstellt werde, wie z. B. eine tabellarische Aufbereitung.

Zusammengefasste oder gruppierte Daten zur Vereinfachung oder Übersichtlichkeit.




Unterscheidung nach Datentyp in der Programmierung, z. B.:




Integer (Ganzzahlen) Float (Fließkommazahlen) String (Zeichenkette) Boolean (Boolesche Werte)
repräsentiert ganze Zahlen, ohne Dezimalstellen Darstellung von Dezimalzahlen mit Nachkommastellen  repräsentieren Text oder Zeichenketten

Datentypen, die nur zwei mögliche Werte haben: Wahr (True) oder Falsch (False). 
Beispiele sind 1, -5 und 100. Beispielsweise:
3.76549034
Beispiele sind "Hallo, Welt!" oder auch "12345". Verwendung z. B. in bedingten Anweisungen und logischen Ausdrücken


Unterscheidung nach Verwendungszweck, z. B.:



Fach

Geschichte

Medizin

Maschinenbau

Datenbeschreibung

Archivdaten

Patientendaten

Konstruktionsdaten

Verwendungszweck


historische Netzwerkforschung und Dokumentation
             
medizinische Versorgung und Forschung


technische Planung und Entwicklung


Forschungsgegenstand



Historische Dokumente, Briefe,
Tagebücher
 

Medizinische Aufzeichnungen,
Laborergebnisse


Technische Zeichnungen,
Computer-Aided-Design-Modelle (CAD)


Medientyp

Text

Text und Zahlen

Grafiken und technische Notation

Datei-Format




Digitalisierte Papiervorlagen
(TIFF, JPEG2000) 



Elektronische Patientenakte (EPA)



AutoCAD-Zeichnungen (DWG)
Austauschformat für 3-D-Modelle (STEP)

Software



Archivverwaltungssoftware (z. B. AtoM), Texterkennungssoftware (OCR)

Software für Patientenakten (z. B. Epic),
medizinische Bildverarbeitungssoftware (z. B. OsiriX)


Software für technische Zeichnungen (z. B. AutoCAD) 
Software für CAD-Modellierung (z. B. SolidWorks)





Exkurs Binärcode

Letztendlich bestehen alle digitalen Daten auf unterster Zeichenebene aus einer Abfolge von binären Zahlen (0 und 1), dem sogenannten Binär- oder auch Maschinencode, welcher verwendet wird, wenn Daten von einem Computer verarbeitet werden. Die Nullen und Einsen repräsentieren dabei die Zustande 'AN' und 'AUS' bzw. richtiger 'niedrige elektrische Spannung' und 'hohe elektrische Spannung'.

Umwandlung in Binärcode
Um die Umwandlung von menschenlesbarem zu maschinenlesbarem Code zu veranschaulichen, stellen wir Ihnen hier beispielhaft einen Binärcode-Konverter für Text gemäß dem Zeichenkodierungsschema American Standard Code for Information Interchange (8 Bit) zur Verfügung.

ToDo:
Lassen Sie sich zunächst den im Binärcode kodierten Text mit Klick auf 'Umwandeln' anzeigen, um näheres über den Standard zu erfahren. Spielen Sie mit dem Beispielcode oder erzeugen Sie eigene Übersetzungen. Finden Sie z. B. heraus, wie Zeilenumbrüche oder Leerzeichen kodiert sind?






Generieren Sie hier selbst eine Ausgabe in Binärcode.





Forschungsdaten I



Als Forschungsdaten können alle Daten aufgefasst werden, die innerhalb des Forschungsprozesses entstehen. Welche Art von Daten dies genau sind, wird innerhalb von Definitionen in der Regel nicht näher bestimmt, da dies abhängig vom Kontext der Verwendung ist.

Folgende drei Definitionen von Forschungsdaten präsentieren wir Ihnen:

Unter digitalen Forschungsdaten verstehen wir [...] alle digital vorliegenden Daten, die während des Forschungsprozesses entstehen oder ihr Ergebnis sind.
(Kindlinger & Schirmbacher, 2013)
Forschungsdaten sind (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse.
(Universität Konstanz, o. J. a)


Zu Forschungsdaten zählen u. a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten oder Beobachtungsdaten, methodische Testverfahren sowie Fragebögen. Korpora und Simulationen können ebenfalls zentrale Ergebnisse wissenschaftlicher Forschung darstellen und werden daher ebenfalls unter den Begriff Forschungsdaten gefasst. Da Forschungsdaten in einigen Fachbereichen auf der Analyse von Objekten basieren (z. B. Gewebe-, Material-, Gesteins-, Wasser- und Bodenproben, Prüfkörper, Installationen, Artefakte und Kunstgegenstände), muss der Umgang mit diesen ebenso sorgfältig sein und eine fachlich adäquate Nachnutzungsmöglichkeit, wann immer sinnvoll und möglich, mitgedacht werden. Ähnliches gilt, wenn Software für die Entstehung oder Verarbeitung von Forschungsdaten erforderlich ist.
(Deutsche Forschungsgemeinschaft, o.J. b)


Folglich können Forschungsdaten in sehr verschiedenen Formen vorliegen. Sie dienen als Grundlage der wissenschaftlichen Arbeit, der Dokumentation des Zustandekommens der Daten und Information und zur Präsentation der Ergebnisse in nachvollziehbarer Weise. Aufgrund der überwiegenden Verwendung digitaler Medien geht man in den meisten Fällen davon aus, dass Forschungsdaten in digitaler Form vorliegen, was jedoch die Einbeziehung analog vorkommender Daten nicht ausschließt.



Info! Der planvolle Umgang mit Forschungsdaten nimmt im Wissenschaftsbetrieb eine zunehmend wichtige Rolle ein, denn durch die Nutzung digitaler Technologien entstehen einerseits zunehmende große Datenmengen, und andererseits eröffnen sich neue analytisch-methodische Zugangswege, die eine zielgerichtete Verwaltung der Daten entlang des gesamten Forschungsprozesses erfordern.



ToDo: Wiederholung zu 'Was sind Daten?'