Datenübernahme

  • Creative Commons License
    Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 Internationale Lizenz.

    Datendokumentation

    Eine durchdachte Organisation und Aufbereitung von Forschungsdaten bedeutet zunächst zusätzlichen Aufwand. Doch im Verlauf eines Projektes spart es Zeit und Mühe, wenn Forschungsdaten von Beginn an sorgfältig strukturiert und aufbereitet werden. Des Weiteren können Forschungsdaten von anderen Forschenden nur dann weiter verwendet werden, wenn diese mit verständlichen Informationen angereichert wurden. Hierzu gehört beispielsweise das dazugehörige Dokumentationsmaterial, welches in konsistenter und verständlicher Weise für die Datenübernahme in eine Forschungsdateninfrastruktur bereitgestellt werden sollte.

    Um Forschungsdaten zu publizieren, ist eine für Dritte nachvollziehbare Dokumentation unabdingbar, denn diese erleichtert die weitere Nutzung der Daten erheblich und stellt deren Reproduzierbarkeit sicher. Dies hat nicht nur Vorteile für potentielle Nachnutzende von Daten, sondern auch für Datenerzeugende sowie für Datenautorinnen und -autoren selbst. Je besser ein Datensatz dokumentiert ist, desto wahrscheinlicher ist es, dass dieser von Dritten genutzt und zitiert wird und Datenerzeugende dadurch „credit“ in Form einer wissenschaftlichen Zitation erhalten.

    Wenn keine Vorgaben (durch Fördereinrichtungen oder Repositorien) gemacht werden, muss eine geeignete Dokumentationsform selbst bestimmt werden. Hierfür kann man sich am Datenlebenszyklus orientieren. In der Verarbeitungs- und Auswertungsphase sollte die Dokumentation mit den entstehenden Versionen aktualisiert werden. Die Dokumentation kann in einem simplen Text-Dokument, mithilfe einer Software oder auch analog, beispielsweise in einem Laborbuch durchgeführt werden. Wenn eine analoge Form der Dokumentation gewählt wird, ist es wichtig, dass auf dokumentenechtes Schreibwerkzeug geachtet wird. Wer eine elektronische Form der Dokumentation nutzt, sollte ein möglichst offenes Format wählen, um so den Zugang zu den Informationen und damit die Nachnutzung der Daten zu erleichtern.

    Dokumentation anhand von Metadaten

    Die Beschreibung von Forschungsdaten erfolgt anhand von Metadaten. Metadaten enthalten strukturierte Informationen über andere Daten und deren Merkmale. Sie sorgen dafür, dass digitale Daten und Objekte gefunden und durchsucht werden können. Im folgenden Videotutorial erfahren Sie, was Metadaten sind und warum sie verwendet werden sollten.

    Metadaten werden entweder unabhängig oder zusammen mit den Daten, die sie beschreiben, gespeichert. Damit sie (potentiell) auch maschinenlesbar sind, zum Beispiel im Semantic Web, werden sie häufig im XML-Format gespeichert.

    Weiterführende Informationen finden Sie im Artikel „Was sind Metadaten?“ im Grundlagenbereich.

    Was sollte dokumentiert werden?

    • Kontext der Erhebung (Projektziele, Hypothesen)
    • Erhebungsmethode (Sampling-Methode, Erhebungsinstrumente, verwendete Hard- und Software, sekundäre Datenquellen, Erhebungsort und Erhebungszeitraum)
    • Struktur der Daten und deren Beziehungen zueinander
    • Qualitätsmaßnahmen wie Bereinigung, Gewichtung, Datenprüfung etc.
    • Datenversionen und die enthaltenen Änderungen
    • Informationen zum Zugang, Nutzungsbedingungen und Vertraulichkeit