Transformation

  • Creative Commons License
    Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 Internationale Lizenz.

    Konvertierung

    Ergeben sich während der Erhaltungsphase aufgrund von sich ändernden Technologien und/oder Anforderungen der Nutzendenzielgruppe Anpassungsnotwendigkeiten der Daten oder der Bereitstellungsmaßnahmen, so muss über diese Änderungen sorgfältig entschieden werden.  

    Zunächst müssen die neuen Anforderungen definiert, Alternativen evaluiert, die Ergebnisse analysiert und im Anschluss ein neuer Erhaltungsplan erstellt werden. Dieser Plan führt möglicherweise dazu, dass die genutzte Software oder die verwendeten Dateiformate angepasst werden müssen. Eine gegebenenfalls anfallende Konvertierung der Daten kann mit entsprechend eingesetzter Konvertierungssoftware auch bei Nutzung der Daten und einem entsprechenden Zugriff erfolgen.

    Bereits die Zugehörigkeit zu einer Fachdisziplin und der damit zusammenhängenden Wahl der Messmethode führt häufig zu bestimmten Datenformaten, die von der Forschungsgemeinschaft sinnvoll eingesetzt werden können. Damit hängt auch die Verwendung „typischer“ Erhebungs- und Auswertungstools und entsprechender Software zusammen, die in der Regel mit eigenen Dateiformaten arbeiten, aber häufig bereits eine Exportmöglichkeit für andere Dateiformate implementiert haben. 

    Je nach Verwendungszusammenhang und Disziplin sind bestimmte Datenformate populärer als andere. Für statistische Analysen sind etwa SPSS, R, SAS und STATA gängige Programme. Möchte man nun beispielsweise eine SPSS-Datei (*.sav) in anderen Programmen öffnen, muss die Datei zur Nutzung konvertiert werden. 

    Konvertierung meint den Prozess, wenn Daten von einem Format in ein anderes übertragen werden. Für die Konvertierung gilt es, sich in jedem Fall vorab genau über die verschiedenen Möglichkeiten in Abhängigkeit des Ausgangs- und des Zielformates kundig zu machen. Dazu findet man zumeist entsprechende Hinweise in den Hilfemenüs der jeweiligen Software.

    Grundsätzlich gibt es für die Datenkonvertierung unterschiedliche Wege:

    Konvertierung durch Datenexport

    In diesem konkreten Beispiel lassen sich in SPSS (Version 24) unter “Datei – Exportieren” verschiedene Formate anderer Statistiksoftware wie STATA oder SAS auswählen, beziehungsweise unter “Datei – Speichern unter” sogar verschiedene Versionen der jeweiligen Statistikprogramme bestimmen. Damit lässt sich unmittelbar ein anderes Datenformat per Datenexport generieren und die Daten können im „neuen“ Statistikprogramm im adäquaten Dateiformat geöffnet werden.

    Konvertierung beim Datenimport

    Die Konvertierung von SPSS-Dateien in R-fähige Datenformate lässt sich mit Hilfe verschiedener Anwendung direkt in R lösen. Hier wird die Konvertierung des Datenformates entsprechend mit dem Import der Daten vollzogen.

    Die Konvertierung in andere Dateiformate kann verlustfrei (die neuen Daten enthalten alle Informationen, die im Original vorhanden waren), verlustbehaftet (die neuen Daten enthalten nicht mehr alle Informationen aus dem Original) oder sinnhaft(Konvertierung „dem Sinne nach“; der wesentliche Inhalt bleibt mit oder ohne Informationsverlust bestehen) vollzogen werden, wobei die verlustfreie Konvertierung angestrebt werden sollte. Manchmal müssen Sie sich jedoch zum Beispiel für eine geringere Dateigröße entscheiden, was mit einem Informationsverlust „bezahlt“ werden muss.

    In Zusammenhang mit der anfallenden Datentransformation kann es (beispielsweise durch sich ändernde Anforderungen der Forschungscommunity, neuer Erkenntnisse im relevanten Forschungsbereich oder neuer Forschungsmöglichkeiten) auch sinnvoll oder notwendig sein, einen Datensatz zu ergänzen oder in Subdatensätze zu teilen.