Modul: Woran orientieren sich WissenschaftlerInnen bei der Handhabung ihrer Daten?
Website: | ORCA.nrw |
Kurs: | Grundwissen: Datenmanagement in Studium & wissenschaftlicher Praxis |
Buch: | Modul: Woran orientieren sich WissenschaftlerInnen bei der Handhabung ihrer Daten? |
Gedruckt von: | Gast |
Datum: | Freitag, 22. November 2024, 15:07 |
Über dieses Modul
Hier erfahren Sie etwas über die Grundlagen des
Forschungsdatenmanagements. Nach einer kurzen Wiederholung zur
Kommunikation im Forschungsprozess und der Definition von
Forschungsdaten wird neben einer Einführung in den Datenlebenszyklus
besonders der Aspekt der Nachnutzung von Forschungsdaten fokussiert.
- Forschungsdatenmanagement
- Forschungsdatenlebenszyklus
Forschungsprozess & Kommunikation II
Wiederholung zum Informationsaustausch in der Wissenschaft
Forschungsdaten II
Wiederholung Definition Forschungsdaten
Angeführt waren dazu diese drei folgenden Beschreibungen:
(Kindlinger & Schirmbacher, 2013)
(Universität Konstanz, o. J. a)
(Deutsche Forschungsgemeinschaft, o.J. b)
Forschungsdatenmanagement
Der spezielle Bereich innerhalb des Wissenschaftsbetriebs, der sich mit der Organisation und Verwaltung von Forschungsdaten beschäftigt, wird als
Forschungsdatenmanagement (kurz FDM) bezeichnet.
Ziel des Forschungsdatenmanagements
Die Zielstellung des Forschungsdatenmanagements ist es, Forschungsdaten "langfristig und personenunabhängig zugänglich, nachnutzbar und nachprüfbar zu halten" (Universität Konstanz, o. J. b).
Das Forschungsdatenmanagement trägt durch diese Zielstellung zu einem großen Teil zur Einhaltung der Prinzipien der Guten Wissenschaftlichen Praxis bei, insbesondere vor dem Hintergrund wachsender digital gestützter Arbeits- und Erkenntnismethoden. Dabei ist es von Bedeutung, die stetig wachsenden Datenmengen so aufzubereiten und zu handhaben, dass die Daten
- leicht aufgefunden,
- zugänglich gemacht,
- in verschiedenen technischen Systemen genutzt
- sowie in zukünftige Forschungsarbeiten wiederverwendet werden können.
Weiterverwendung von Forschungsdaten
ToDo:
(Hanson, Surkis & Yacobucci, 2012)
Datenlebenszyklus
Planung
Nur mit guter Planung
können auch gute Ergebnisse erzielt werden. Dies erfordert reifliche
Überlegung und Absprachen. In Bezug auf das
Forschungsdatenmanagement verlangen viele Forschungsförderer bereits bei
der Antragsstellung von Forschenden einen sogenannten
Datenmanagementplan (kurz DMP). Konkrete Hinweise zum Umgang mit Forschungsdaten und der Planung dessen lassen sich in den Richtlinien der Universitäten, Forschungseinrichtungen und wissenschaftlicher Fachgesellschaften finden.
Doch auch ohne explizite
Vorgaben Dritter lohnt es sich, bereits im Vorfeld genau schriftlich
festzuhalten, wie mit den Daten
umgegangen werden soll. Das schafft Verbindlichkeit und
Einheitlichkeit, insbesondere bei Forschungsprojekten mit mehreren Beteiligten.
Folgende Aspekte sollten bedacht werden:
- Untersuchungsdesign festlegen
- Zeitplan aufstellen
- Datenmanagementplan erstellen (z. B. Festlegung Formate, Speicherorte, Dateibenennung)
- bereits existierende Literatur und Daten sichten
- ggf. Nachnutzung vorhandener Daten
- Urheberschaft und Datenbesitz klären
- Zugriffsmöglichkeiten und -bedingungen abstimmen
Detail Planung
Datenmanagementplan
ToDo:
Erhebung
Die Form und methodische Ausgestaltung der Datenerhebung liegt vollständig in der Verantwortung der jeweiligen Fachwissenschaft und wird im Rahmen von Forschungs- und Methodenseminaren an Studierende vermittelt.
Die Datenerhebung kann mitunter einen erheblichen Teil einer Forschungsarbeit ausmachen. Zudem ziehen sich Fehler, die in dieser Phase nicht behoben werden, durch den gesamten weiteren Forschungsprozess und führen im schlimmsten Fall unbemerkt zu falschen Ergebnissen. Umso wichtiger ist es, bei der Erhebung besondere Sorgfalt walten zu lassen. Neben den eigentlichen Daten betrifft dies vor allem die Dokumentation der durchgeführten Forschungsarbeiten.
Folgende Aspekte sollten bedacht werden:
- Durchführung der Experimente, Beobachtungen, Messungen, Simulationen etc.
- Erzeugung von digitalen Rohdaten (z. B. durch Digitalisieren oder Transkribieren)
- Speicherung der Daten in einem einheitlichen Format
- Sicherung (Backup) und Verwaltung der Daten
- Erfassung und Erstellung von Metadaten
- Dokumentation der Datenerhebung
Analyse
Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)Bei der Analyse ihrer Daten kennen sich Wissenschaftlerinnen und Wissenschaftler am besten aus. Genau wie bei der Datenerhebung obliegt Ihnen bei der Datenanalyse die vollständige fachlich-methodische Zuständigkeit.
Aus Sicht des Forschungsdatenmanagements ist wichtig, dass bei der Analyse von Daten übliche fachliche Standards und Methoden angewendet werden und die Vorgehensweise dokumentiert wird. Für die Nachvollziehbarkeit und vor
allem für die Zusammenarbeit mehrerer Personen ist es wichtig, dass diese ein einheitliches System zur Dateibenennung, Versionierung und Datenorganisation verwenden.
Folgende Aspekte sollten bedacht werden:
- Daten prüfen, validieren, bereinigen (Qualitätssicherung)
- Daten ableiten, aggregieren, harmonisieren
- Fachspezifische Standards nutzen (z. B. hinsichtlich Methoden und Dateiformaten)
- Nutzung der Daten in wissenschaftlichen Publikationen vorbereiten
- Datenverarbeitung dokumentieren (zum späteren Verständnis)
- Kooperationsplattformen zum Datenaustausch mit (Fach-)Kolleg*innen nutzen
- Analysen durchführen
- Daten interpretieren
Archivierung
Rohdaten aus der Forschung sollten "in der Regel für einen Zeitraum
von zehn Jahren zugänglich und nachvollziehbar in der Einrichtung,
wo sie entstanden sind, oder in standortübergreifenden Repositorien
aufbewahrt" werden (Leitlinie 17, Deutsche Forschungsgemeinschaft, o. J. a). Dies dient der wissenschaftlichen
Qualitätssicherung und ermöglicht die langfristige
Überprüfbarkeit wissenschaftlicher Erkenntnisse. Zudem können die
Daten ggf. auch für weitere Forschung genutzt werden.
Um eine Archivierung zu ermöglichen, müssen einige Voraussetzungen erfüllt sein:
- Verständlichkeit der Dokumentation
- langlebige Dateiformate
- langlebige Speichermedien
Detail: DFG Leitlinie Archivierung
Zugang
Forschungsdatenlebenszyklus angelehnt an Der Lebenszyklus von Forschungsdaten (Hessische Forschungsdateninfrastruktur, 2022)
Neben der (Text-)Publikation werden auch die Forschungsdaten, auf denen sie basieren, immer
gefragter. Viele Forschungsförderer und Journals für wissenschaftliche Veröffentlichungen verlangen mittlerweile
sogar explizit eine Datenpublikation.
Grundsätzlich gibt es drei Arten der Veröffentlichung von Forschungsdaten (Biernacka et al., 2018):
- Als Beigabe zu einem wissenschaftlichen Fachartikel (= data supplement)
- Als eigenständige Veröffentlichung in einem Repositorium (= langfristiger Speicherort für Daten)
- Als Artikel in einem Data Journal: Dies sind (in der Regel) peer-reviewte Paper, die Datensätze mit hohem Wiederverwendungswert vorstellen und näher beschreiben. Die Daten selbst sind meist in einem Forschungsdatenrepositorium veröffentlicht.
Nachnutzung
- Dürfen die Daten aus datenschutz- und urheberrechtlicher Sicht öffentlich gemacht werden?
- Sind die Daten nachvollziehbar dokumentiert?
- Sind die Daten in ihrer Qualität überprüft worden?
ToDo: Wiederholung
Relevanz FDM
ToDo: Leitlinie 7 GWP
- Warum ist die Kenntlichmachung der Herkunft von im Forschungsprozess verwendeten Daten, Organismen, Materialien und Software wichtig? Wie trägt dies zur Qualitätssicherung bei?
- In welcher Weise sollten Forschungsdaten im Forschungsprozess beschrieben und behandelt werden, um den Anforderungen des jeweiligen Fachgebiets gerecht zu werden?
- Warum ist es entscheidend, dass Ergebnisse und Erkenntnisse durch andere Wissenschaftlerinnen und Wissenschaftler repliziert oder bestätigt werden können?
Ausgewählte Gründe für Forschungsdatenmanagement
Z. B. erreicht das Forschungsdatenmanagement:
Transparenz und GlaubwürdigkeitDie Offenlegung von Forschungsdaten fördert das Vertrauen in die Forschung, ermöglicht die Überprüfung von Ergebnissen und verhindert potenzielle Fehlinformationen. |
Kosteneffizienz und ZeitersparnisDer Zugang zu bereits gesammelten Daten ermöglicht eine optimierte Nutzung von Ressourcen und spart Zeit, was zu einer effizienteren Forschungslandschaft führt. |
|||
Reproduzierbarkeit und ValidierungDie langfristige Verfügbarkeit von Daten ermöglicht es anderen, Ergebnisse zu reproduzieren und zu validieren, was zur Gewährleistung der Robustheit wissenschaftlicher Erkenntnisse beiträgt. |
Verbesserung der DatenqualitätDie Offenlegung und Überprüfung von Daten fördert die sorgfältige Datenerfassung und -verwaltung, was letztendlich zu verlässlicheren Forschungsergebnissen führt. |
|||
Nachnutzbarkeit und erweiterte Nutzungsmöglichkeiten |
|
Langfristige Sicherung des wissenschaftlichen ErbesDie langfristige und personenunabhängige Verfügbarkeit von Forschungsdaten sichert das wissenschaftliche Erbe für zukünftige Generationen, ermöglicht einen fortwährenden Erkenntnisgewinn und verhindert den Verlust wertvoller Forschungsinhalte. |