Erstellung & Empfang

  • Creative Commons License
    Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 Internationale Lizenz.

    FDM-Beratung: Forschungsdaten organisieren

    Ein erster Schritt um effizient mit Daten umzugehen, ist die Erstellung und Nutzung einer klaren Struktur. Wissenschaftlerinnen und Wissenschaftler, die neu in eine Forschungsgruppe kommen, können sich zunächst erkundigen, ob in der Arbeitsgruppe bereits vorgegebene Strukturen existieren. Zu einer effektiven Datenorganisation gehören grundlegende Punkte wie das Verwenden einer Ordnerstruktur. Jeder Ordner enthält strukturell oder inhaltlich zusammengehörende Daten und sollte dementsprechend benannt werden.

    Tipps für eine Ordnerstruktur

    • Daten in hierarchischer Ordnerstruktur ablegen (z. B. Projekt → Daten, Output, Code, Paper)
    • systematische, inhaltsbezogene Ordnerbenennung verwenden, die für Dritte verständlich ist
    • nicht mehr als drei Unterordner-Ebenen verwenden
    • konsistente Reihenfolge bei Dateibenennung, z. B. bei Datumsangaben: JJJJMMTT_Name
    • Dateinamen sollten ohne Sonderzeichen, Großbuchstaben, Leerzeichen und Punkte auskommen
    • nach Projektende prüfen, welche Dateien noch gebraucht werden, um sie zu archivieren und welche gelöscht werden können

    Versionskontrolle

    Ebenso wichtig wie eine gute Datenorganisation in Ordnerstrukturen ist ein effizienter Umgang mit den einzelnen Daten oder Datensätzen selbst. Dies gilt besonders dann, wenn Datensätze im Laufe des Forschungsvorhabens Veränderungen unterliegen. Ein wichtiger Bestandteil einer Organisationsstrategie ist daher eine funktionierende Versionskontrolle.

    Die strukturierte Versionierung von Dateien kann in einem separaten Versionierungsdokument vorgenommen werden, das die verschiedenen Dokumentversionen mit relevanten Parametern beschreibt (bspw. „Datum letzte Änderung“, „Geändert durch“, „Relevante Änderungen“, etc.).

    Weiterhin lassen sich die Dokumente selbst versionieren, insbesondere durch die Vergabe von ganzen Zahlen für größere Versionsänderungen und mit einem Unterstrich verbundene Zahlen für kleinere Veränderungen (z. B. v1, v2, v1_01 etc.). Es wird davon abgeraten, Bezeichnungen wie final, final2 oder Revision zu benutzen, da hierbei schnell der Überblick verloren geht.

    Es gibt eine Reihe freier Versionierungsverwaltungssoftwares, die zur Organisation von Forschungsdaten verwendet werden können. Die Nutzung einer Versionsverwaltungssoftware ist insbesondere dann ratsam, wenn Sie mit großen Datenmengen umgehen müssen.

    Das Center für Digitale Systeme (CEDIS) der FU Berlin stellt ein Video zur Verfügung, das die Themen der Datendokumentation, der Benennung von Dateien und Daten, der Nachnutzung von Daten, der Sicherung von Daten sowie der Nutzung vorhandener Infrastrukturen behandelt.

    Kollaboratives Arbeiten

    Dokumente und Daten müssen oft in einer kontrollierten und organisierten Art und Weise über mehrere Organisationen oder Forschungseinrichtungen verwaltet werden. Verschiedene Möglichkeiten und Werkzeuge stehen Forschenden heute zur Verfügung. Folgende Anforderungen sollte eine kollaborative Umgebung erfüllen:

    • Speicherung und Austausch von Dateien, Backups
    • Dateien sind in Ordnern organisierbar
    • ein Zutrittskontrollsystem, das die Authentifizierung und Autorisierung verwaltet
    • Versionskontrolle von Dateien
    • Nutzende können gleichzeitig an derselben Datei arbeiten
    • im Idealfall Bereitstellung einer Diskussionsplattform

    Vorsicht bei der Speicherung von Daten in einer Cloud. Die Datensicherung sowie die Besitzrechte sollten unbedingt in den Nutzungsbedingungen überprüft werden bevor Forschungsdokumente dort abgelegt werden !

    Neben den bekannten Cloud Diensten gibt es die Möglichkeit, ein Gruppenlaufwerk an einer Institution einzurichten oder eine virtuelle Forschungsumgebung (z. B. MS Sharepoint) zu verwenden. Empfehlenswerte Tools finden Sie beispielsweise hier.

    Auf der Seite des Verbund Forschungsdaten Bildung findet sich eine sehr ausführliche Übersicht zu den relevanten Themen der Datenorganisation.