Modul: Woran orientieren sich WissenschaftlerInnen bei der Handhabung ihrer Daten?

Website: ORCA.nrw
Kurs: Grundwissen: Datenmanagement in Studium & wissenschaftlicher Praxis
Buch: Modul: Woran orientieren sich WissenschaftlerInnen bei der Handhabung ihrer Daten?
Gedruckt von: Gast
Datum: Freitag, 27. September 2024, 11:24

Über dieses Modul

Hier erfahren Sie etwas über die Grundlagen des Forschungsdatenmanagements. Nach einer kurzen Wiederholung zur Kommunikation im Forschungsprozess und der Definition von Forschungsdaten wird neben einer Einführung in den Datenlebenszyklus besonders der Aspekt der Nachnutzung von Forschungsdaten fokussiert.

  • Forschungsdatenmanagement
  • Forschungsdatenlebenszyklus

Lernziel (Wissen): Die Studentinnen und Studenten können die Phasen des Datenlebenszyklus wiedergeben.
Lernziel (Verstehen): Die Studentinnen und Studenten können Aspekte zur Nachnutzung von Forschungsdaten skizzieren.

Bearbeitungsdauer: ≈ 35 Min.

Forschungsprozess & Kommunikation II

Wiederholung zum Informationsaustausch in der Wissenschaft

Vergegenwärtigen Sie sich zu Beginn dieses Moduls erneut, dass die Kommunikation innerhalb der Wissenschaft einen hohen Stellenwert einnimmt, da über den gegenseitigen Austausch und die Zirkulation von Information Erfahrungen, Ideen und Erkenntnisse geteilt werden. (Vgl. dazu in diesem Kurs Wissenschaftliche Kommunikation in Modul: Wie arbeiten Wissenschaftlerinnen und Wissenschaftler, wie kommunizieren sie darüber und welche ethischen Prinzipien leiten sie?)

Weiterhin hatten wir festgehalten, dass die Offenlegung von Ergebnissen, theoretischen Grundlagen und Herstellungsbedingungen von Forschungsarbeiten ein besonders wichtiger Aspekt des wissenschaftlichen Informationsaustauschs ist. Durch die Offenlegung kann die jeweilige Fachgemeinschaft die Zuverlässigkeit sowie die Qualität der Forschungsarbeit beurteilen, die Ergebnisse auf ihre Richtigkeit prüfen und auf vorhandene Informationen und Daten zur weiteren Forschung zurückgreifen.


Merke! Damit Forschungsergebnisse geprüft, beurteilt und nachgenutzt werden können, müssen sie zugänglich sein! Und wenn es geht, so 'offen' und frei verfügbar wie möglich.

Forschungsdaten II

Wiederholung Definition Forschungsdaten

Zur Beschreibung von Forschungsdaten hatten wir zuvor festgehalten (Vgl. in diesem Kurs Differenzierung von Daten, Forschungsdaten I in Modul: Was sind Daten?), dass Forschungsdaten in sehr verschiedenen Formen vorliegen können. Und sie als Grundlage der wissenschaftlichen Arbeit, der Dokumentation des Zustandekommens der Daten und Information und zur Präsentation der Ergebnisse in nachvollziehbarer Weise dienen.

Angeführt waren dazu diese drei folgenden Beschreibungen:

Unter digitalen Forschungsdaten verstehen wir [...] alle digital vorliegenden Daten, die während des Forschungsprozesses entstehen oder ihr Ergebnis sind.
(Kindlinger & Schirmbacher, 2013)
Forschungsdaten sind (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse.
(Universität Konstanz, o. J. a)


Zu Forschungsdaten zählen u. a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten oder Beobachtungsdaten, methodische Testverfahren sowie Fragebögen. Korpora und Simulationen können ebenfalls zentrale Ergebnisse wissenschaftlicher Forschung darstellen und werden daher ebenfalls unter den Begriff Forschungsdaten gefasst. Da Forschungsdaten in einigen Fachbereichen auf der Analyse von Objekten basieren (z. B. Gewebe-, Material-, Gesteins-, Wasser- und Bodenproben, Prüfkörper, Installationen, Artefakte und Kunstgegenstände), muss der Umgang mit diesen ebenso sorgfältig sein und eine fachlich adäquate Nachnutzungsmöglichkeit, wann immer sinnvoll und möglich, mitgedacht werden. Ähnliches gilt, wenn Software für die Entstehung oder Verarbeitung von Forschungsdaten erforderlich ist.
(Deutsche Forschungsgemeinschaft, o.J. b)

Merke! Forschungsdaten sind all jene Daten, die während des Forschungsprozesses entstehen!

Forschungsdatenmanagement

Der spezielle Bereich innerhalb des Wissenschaftsbetriebs, der sich mit der Organisation und Verwaltung von Forschungsdaten beschäftigt, wird als Forschungsdatenmanagement (kurz FDM) bezeichnet.


















Ziel des Forschungsdatenmanagements

Die Zielstellung des Forschungsdatenmanagements ist es, Forschungsdaten "langfristig und personenunabhängig zugänglich, nachnutzbar und nachprüfbar zu halten" (Universität Konstanz, o. J. b). 

Das Forschungsdatenmanagement trägt durch diese Zielstellung zu einem großen Teil zur Einhaltung der Prinzipien der Guten Wissenschaftlichen Praxis bei, insbesondere vor dem Hintergrund wachsender digital gestützter Arbeits- und Erkenntnismethoden. Dabei ist es von Bedeutung, die stetig wachsenden Datenmengen so aufzubereiten und zu handhaben, dass die Daten 

  • leicht aufgefunden, 
  • zugänglich gemacht,
  • in verschiedenen technischen Systemen genutzt 
  • sowie in zukünftige Forschungsarbeiten wiederverwendet werden können.


Info! An zahlreichen Universitäten und Fachhochschulen sind Servicestellen und -zentren für das Forschungsdatenmanagement eingerichtet. Sie bieten Beratung, Unterstützung sowie Dienstleistungen rund um das Forschungsdatenmanagement für Wissenschaftlerinnen und Wissenschaftler, wie zum Beispiel hier an der Bergischen Universität Wuppertal das Servicezentrum Forschungsdatenmanagement [https://fdm.uni-wuppertal.de].

Weiterverwendung von Forschungsdaten

Manchmal ist es hilfreich, Sachverhalte vom Ende her zu betrachten, um sie sich zu verdeutlichen. Deshalb zeigen wir Ihnen hier ein Szenario zur Nachnutzung von Forschungsdaten, also einem Zeitpunkt an dem die eigentliche Forschungsarbeit bereits abgeschlossen ist.

ToDo:
Das unten gezeigte Video Data Sharing and Management Snafu in 3 Short Acts (Hanson, Surkis & Yacobucci, 2012) zeigt, welche Probleme bei der Weiterverwendung von Forschungsdaten auftreten können.

Schauen Sie sich das Video an und identifizieren Sie die Probleme, die sich im Verlauf des Gesprächs zeigen. Sammeln Sie Ihre Notizen zu den drei Akten im gemeinsamen Notizpad zu dieser Lerneinheit.

Bitte beachten Sie, dass es sich hier um eine Einbettung eines externen Seiteninhalts [https://www.youtube.com/embed/N2zK3sAtr-4?si=RDhGI0o05A_L-31e] handelt.


(Hanson, Surkis & Yacobucci, 2012)

Datenlebenszyklus

Wissenschaftlerinnen und Wissenschaftler können sich beim Forschungsdatenmanagement am Konzept des Datenlebenszyklus orientieren, welches den Umgang mit Daten innerhalb des Forschungsprozesses entlang verschiedener Phasen beschreibt.
schematische Darstellung Datenlebenszyklus

Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Info! Genau wie der Forschungsskreislauf oder auch die Wissenspyramide ist der Datenlebenszyklus ein idealisiertes Konzept, das auf abstrakten Begriffen basiert und zur Verdeutlichung dient. In der praktischen Arbeit werden solche Konzepte zur Orientierung verwendet, jedoch an die spezifischen Gegebenheit angepasst. 
DFG Leitlinie 7 zur Guten Wissenschaftlichen Praxis  „Phasenübergreifende Qualitätssicherung“ verdeutlicht die Wichtigkeit eines planvollen Vorgehens bei Forschungstätigkeiten. Siehe hierzu die entsprechende Leitlinie im Kodex der DFG [https://wissenschaftliche-integritaet.de/kodex/phasenubergreifende-qualitatssicherung/].

Planung


Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)


Nur mit guter Planung können auch gute Ergebnisse erzielt werden. Dies erfordert reifliche Überlegung und Absprachen. In Bezug auf das Forschungsdatenmanagement verlangen viele Forschungsförderer bereits bei der Antragsstellung von Forschenden einen sogenannten Datenmanagementplan (kurz DMP). Konkrete Hinweise zum Umgang mit Forschungsdaten und der Planung dessen lassen sich in den Richtlinien der Universitäten, Forschungseinrichtungen und wissenschaftlicher Fachgesellschaften finden.

Doch auch ohne explizite Vorgaben Dritter lohnt es sich, bereits im Vorfeld genau schriftlich festzuhalten, wie mit den Daten umgegangen werden soll. Das schafft Verbindlichkeit und Einheitlichkeit, insbesondere bei Forschungsprojekten mit mehreren Beteiligten.

 Folgende Aspekte sollten bedacht werden:

  • Untersuchungsdesign festlegen
  • Zeitplan aufstellen
  • Datenmanagementplan erstellen (z. B. Festlegung Formate, Speicherorte, Dateibenennung)
  • bereits existierende Literatur und Daten sichten
  • ggf. Nachnutzung vorhandener Daten
  • Urheberschaft und Datenbesitz klären
  • Zugriffsmöglichkeiten und -bedingungen abstimmen
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Detail Planung

Datenmanagementplan


Forschungsdatenlebenszyklus angelehnt an Darstellung in Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022) CC BY-SA 4.0

Im Studium werden Sie sich voraussichtlich zunächst nicht tiefer mit der Erstellung von Datenmanagementplänen befassen, da diese ein Planungsinstrument für Forschungsprojekte sind. Trotz dessen lohnt sich für Sie ein Blick auf die planerischen Grundlagen, da diese für Ihre zukünftige wissenschaftliche Tätigkeit oder auch ganz allgemein für das spätere Berufsleben von Bedeutung sein können.

ToDo:
Das unten gezeigte Video Was sind Datenmanagementpläne? (Humboldt Universität Berlin, 2017) erklärt, was Datenmanagementpläne sind, wozu sie benötigt werden und welche Aspekte in einem Datenmanagementplan behandelt werden.

(Humboldt Universität Berlin, 2017)

Erhebung


Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Die Form und methodische Ausgestaltung der Datenerhebung liegt vollständig in der Verantwortung der jeweiligen Fachwissenschaft und wird im Rahmen von Forschungs- und Methodenseminaren an Studierende vermittelt.

Die Datenerhebung kann mitunter einen erheblichen Teil einer Forschungsarbeit ausmachen. Zudem ziehen sich Fehler, die in dieser Phase nicht behoben werden, durch den gesamten weiteren Forschungsprozess und führen im schlimmsten Fall unbemerkt zu falschen Ergebnissen. Umso wichtiger ist es, bei der Erhebung besondere Sorgfalt walten zu lassen. Neben den eigentlichen Daten betrifft dies vor allem die Dokumentation der durchgeführten Forschungsarbeiten.

Folgende Aspekte sollten bedacht werden:

  • Durchführung der Experimente, Beobachtungen, Messungen, Simulationen etc.
  • Erzeugung von digitalen Rohdaten (z. B. durch Digitalisieren oder Transkribieren) 
  • Speicherung der Daten in einem einheitlichen Format
  • Sicherung (Backup) und Verwaltung der Daten
  • Erfassung und Erstellung von Metadaten
  • Dokumentation der Datenerhebung
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Analyse

Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Bei der Analyse ihrer Daten kennen sich Wissenschaftlerinnen und Wissenschaftler am besten aus. Genau wie bei der Datenerhebung obliegt Ihnen bei der Datenanalyse die vollständige fachlich-methodische Zuständigkeit.

Aus Sicht des Forschungsdatenmanagements ist wichtig, dass bei der Analyse von Daten übliche fachliche Standards und Methoden angewendet werden und die Vorgehensweise dokumentiert wird. Für die Nachvollziehbarkeit und vor allem für die Zusammenarbeit mehrerer Personen ist es wichtig, dass diese ein einheitliches System zur Dateibenennung, Versionierung und Datenorganisation verwenden.

Folgende Aspekte sollten bedacht werden:

  • Daten prüfen, validieren, bereinigen (Qualitätssicherung)
  • Daten ableiten, aggregieren, harmonisieren
  • Fachspezifische Standards nutzen (z. B. hinsichtlich Methoden und Dateiformaten)
  • Nutzung der Daten in wissenschaftlichen Publikationen vorbereiten
  • Datenverarbeitung dokumentieren (zum späteren Verständnis)
  • Kooperationsplattformen zum Datenaustausch mit (Fach-)Kolleg*innen nutzen
  • Analysen durchführen
  • Daten interpretieren
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Archivierung


Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Rohdaten aus der Forschung sollten "in der Regel für einen Zeitraum von zehn Jahren zugänglich und nachvollziehbar in der Einrichtung, wo sie entstanden sind, oder in standortübergreifenden Repositorien aufbewahrt" werden (Leitlinie 17, Deutsche Forschungsgemeinschaft, o. J. a). Dies dient der wissenschaftlichen Qualitätssicherung und ermöglicht die langfristige Überprüfbarkeit wissenschaftlicher Erkenntnisse. Zudem können die Daten ggf. auch für weitere Forschung genutzt werden.

Um eine Archivierung zu ermöglichen, müssen einige Voraussetzungen erfüllt sein:

  • Verständlichkeit der Dokumentation
  • langlebige Dateiformate 
  • langlebige Speichermedien 
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Detail: DFG Leitlinie Archivierung



Hier betten wir Ihnen zur näheren Beschäftigung mit dem Thema Archivierung die entsprechende Stelle aus dem Kodex der DFGLeitlinien zur Sicherung guter wissenschaftlicher Praxis (Deutsche Forschungsgemeinschaft, o. J. a) ein.

Bitte beachten Sie, dass es sich hier um eine Einbettung eines externen Seiteninhalts [https://wissenschaftliche-integritaet.de/kodex/archivierung/] handelt.

Zugang


Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Neben der (Text-)Publikation werden auch die Forschungsdaten, auf denen sie basieren, immer gefragter. Viele Forschungsförderer und Journals für wissenschaftliche Veröffentlichungen verlangen mittlerweile sogar explizit eine Datenpublikation.

Grundsätzlich gibt es drei Arten der Veröffentlichung von Forschungsdaten (Biernacka et al., 2018):

  1. Als Beigabe zu einem wissenschaftlichen Fachartikel (= data supplement)
  2. Als eigenständige Veröffentlichung in einem Repositorium (= langfristiger Speicherort für Daten)
  3. Als Artikel in einem Data Journal: Dies sind (in der Regel) peer-reviewte Paper, die Datensätze mit hohem Wiederverwendungswert vorstellen und näher beschreiben. Die Daten selbst sind meist in einem Forschungsdatenrepositorium veröffentlicht.
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Nachnutzung


Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Nachnutzung bezeichnet die Praxis, auf bereits bestehende Forschungsdaten zuzugreifen und sie für weitere Forschung heranzuziehen. So können Wissenschaftlerinnen und Wissenschaftler teils auf eigene, aufwändige Erhebungen verzichten oder z. B. Ergebnisse und Hypothesen prüfen sowie verschiedene Datensätze miteinander verknüpfen.

Fragen, die sich zur Nachnutzung z. B. stellen:

  1. Dürfen die Daten aus datenschutz- und urheberrechtlicher Sicht öffentlich gemacht werden?
  2. Sind die Daten nachvollziehbar dokumentiert?
  3. Sind die Daten in ihrer Qualität überprüft worden?
Dieser Text basiert auf dem Kapitel Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)

Tipp! Bei der Weitergabe und Veröffentlichung von Forschungsdaten achten Wissenschaftlerinnen und Wissenschaftler darauf, dass die Daten und Datensätze tatsächlich nachgenutzt werden dürfen. Voraussetzung für die Nachnutzung ist die Vergabe einer entsprechenden Nutzungslizenz.

ToDo: Wiederholung



Relevanz FDM

ToDo: Leitlinie 7 GWP

Recherchieren Sie in den unten bereitgestellten Erläuterungen zur  Leitlinie 7 'Phasenübergreifende Qualitätssicherung' im DFG-Kodex (Deutsche Forschungsgemeinschaft, o. J. a) zur Guten Wissenschaftlichen Praxis und diskutieren Sie folgende Fragen:

  1. Warum ist die Kenntlichmachung der Herkunft von im Forschungsprozess verwendeten Daten, Organismen, Materialien und Software wichtig? Wie trägt dies zur Qualitätssicherung bei?
  2. In welcher Weise sollten Forschungsdaten im Forschungsprozess beschrieben und behandelt werden, um den Anforderungen des jeweiligen Fachgebiets gerecht zu werden?
  3. Warum ist es entscheidend, dass Ergebnisse und Erkenntnisse durch andere Wissenschaftlerinnen und Wissenschaftler repliziert oder bestätigt werden können?
Sammeln Sie Ihre Ergebnisse im gemeinsamen Notizpad zu dieser Lerneinheit.

Bitte beachten Sie, dass es sich hier um eine Einbettung eines externen Seiteninhalts [https://wissenschaftliche-integritaet.de/kodex/phasenubergreifende-qualitatssicherung/] handelt.

Ausgewählte Gründe für Forschungsdatenmanagement

Auf einen ersten Blick mag das Forschungsdatenmanagement zunächst als aufwändig erscheinen, allerdings zahlt sich der planvolle Umgang rund um die Forschungsdaten mittel- bis langfristig aus, insbesondere wenn es um die Veröffentlichung von Forschungsergebnissen geht.

Z. B. erreicht das Forschungsdatenmanagement:





Transparenz und Glaubwürdigkeit

Die Offenlegung von Forschungsdaten fördert das Vertrauen in die Forschung, ermöglicht die Überprüfung von Ergebnissen und verhindert potenzielle Fehlinformationen.


Kosteneffizienz und Zeitersparnis

Der Zugang zu bereits gesammelten Daten ermöglicht eine optimierte Nutzung von Ressourcen und spart Zeit, was zu einer effizienteren Forschungslandschaft führt.




Reproduzierbarkeit und Validierung

Die langfristige Verfügbarkeit von Daten ermöglicht es anderen, Ergebnisse zu reproduzieren und zu validieren, was zur Gewährleistung der Robustheit wissenschaftlicher Erkenntnisse beiträgt.


Verbesserung der Datenqualität

Die Offenlegung und Überprüfung von Daten fördert die sorgfältige Datenerfassung und -verwaltung, was letztendlich zu verlässlicheren Forschungsergebnissen führt.




Nachnutzbarkeit und erweiterte Nutzungsmöglichkeiten

Durch die Zugänglichkeit von Forschungsdaten können diese nicht nur von anderen Forscherinnen und Forschern, sondern auch von der Öffentlichkeit oder zu Lehrzwecken genutzt werden, was zu einer vielfältigen Verwendung führt.



    
Langfristige Sicherung des wissenschaftlichen Erbes

Die langfristige und personenunabhängige Verfügbarkeit von Forschungsdaten sichert das wissenschaftliche Erbe für zukünftige Generationen, ermöglicht einen fortwährenden Erkenntnisgewinn und verhindert den Verlust wertvoller Forschungsinhalte.