Zusammenfassung
Die Verfügbarkeit von Forschungsdaten ist für Forschende in den empirischen Sozialwissenschaften eine notwendige Voraussetzung ihres wissenschaftlichen Arbeitens. Bedingt durch moderne Arbeitsinstrumente stieg in den letzten Jahren nicht nur das Volumen an Forschungsdaten, sondern auch deren Komplexität stetig an (Ludwig/Enke 2013: 13). Auffällig ist dabei die wiederholte Erhebung von vergleichbaren Forschungsdaten in ähnlichen Kontexten durch unterschiedliche Forschungsprojekte. So neigen immer noch viele Forschende dazu, die für ihre Forschungsarbeit notwendigen Daten selbst zu erheben und aufzubereiten. Die Möglichkeit, bereits existierende Forschungsdaten systematisch zu evaluieren und im Rahmen einer Sekundäranalyse nachzunutzen, wird hingegen nur bedingt wahrgenommen. Unter dem Begriff der Sekundäranalyse verstehen wir im Folgenden die „Methode, bereits vorhandenes Material (Primärerhebung) unabhängig von dem ursprünglichen Zweck und Bezugsrahmen der Datensammlung auszuwerten“ (Friedrichs 1990: 353). Mit anderen Worten werden in der Sekundäranalyse „keine Daten erhoben, vielmehr wird auf bereits existierende Datenbestände zurückgegriffen“ (Stier 1996: 234). Dieser Rückgriff ist jedoch an eine Reihe von Voraussetzungen geknüpft. Hierzu gehören u.a. die Zugänglichkeit und Verständlichkeit der Ausgangsdaten ebenso wie entsprechende Nachnutzungsrechte. Dementsprechend hängt die Möglichkeit, Forschungsdaten für die Sekundäranalyse nutzen zu können, auch davon ab, ob die Primärforschenden, d.h. die ursprünglichen Datenproduzierenden, entsprechende Maßnahmen in ihrem Forschungsdatenmanagement berücksichtigt haben. Doch auch in der Sekundäranalyse ist ein geeignetes Forschungsdatenmanagement als Teil guter wissenschaftlicher Praxis von zentraler Bedeutung. Es fördert den reibungslosen Ablauf im Forschungsprojekt und ist eine grundlegende Voraussetzung zur erfolgreichen Umsetzung des Forschungsvorhabens. Es sichert Transparenz im Forschungsprojekt und ermöglicht die Replikation erzielter Forschungsergebnisse ebenso wie die Reproduktion generierter Forschungsdaten (Büttner/Hobohm/Müller 2011; Freese 2007; Fowler 1995). Darüber hinaus kommen Forschende mit Hilfe des Forschungsdatenmanagements in der Sekundäranalyse ggf. Auflagen Dritter nach, z.B. im Rahmen der Publikation ihrer Forschungsergebnisse (Pampel/Bertelmann 2011). So fordern etwa im deutschsprachigen Raum immer mehr Journals die Replizierbarkeit von Forschungsergebnissen ebenso wie die Reproduzierbarkeit von Forschungsdaten aktiv ein, wie z.B. die Politische Vierteljahresschrift oder die Zeitschrift für Soziologie. Schließlich bedeutet die Nachnutzung bereits existierender Forschungsdaten nicht per se, dass dabei keine ‚neuen‘ Forschungsdaten erzeugt werden. So kann das Zusammenspielen unterschiedlicher Individualdatensätze, etwa über Regionaleinheiten wie Länder oder über die Zeit hinweg, zur Erstellung neuer Daten in der Sekundäranalyse führen (vgl. z.B. Schnell/Hill/Esser 2013: 242f; Jensen 2012: 11). Die dem Zusammenspielen zugrunde liegenden Harmonisierungskonzepte (zur softwarebasierten Dokumentation der Harmonisierung von Variablen vgl. z.B. Winters/Netscher 2016: 5f.) sind dabei möglicherweise wiederum für Dritte zur weiteren Nutzung von Interesse. Trotz dieser vielfältigen Gründe für ein Forschungsdatenmanagement in der Sekundäranalyse fehlen in den Sozialwissenschaften bislang allgemein anerkannte Standards. Um dieser Lücke zu begegnen, versucht das vorliegende Kapitel eine erste Beschreibung des Forschungsdatenmanagements in der Sekundäranalyse quantitativer sozialwissenschaftlicher Daten. Der Schwerpunkt dieses Kapitels liegt in der Reproduzierbarkeit der verwendeten Daten. Die Replizierbarkeit der Forschungsergebnisse, etwa durch die Sicherung entsprechender Programmcodes zur Datenanalyse, werden in diesem Kapitel hingegen nicht weiter thematisiert. Interessierte Lesende finden grundlegende Hinweise und Verfahrensweisen zur Dokumentation der Datenanalyse beispielsweise bei Scott J. Long (2009) oder Thomas Ebel (2016). Im folgenden Abschnitt (8.1) werden zunächst einige Voraussetzungen zur Nachnutzung bereits existierender Daten erörtert, wie deren Auffindbarkeit und Verständlichkeit oder bestehende Nachnutzungsrechte. Daran anschließend werden in Abschnitt 8.2 Gemeinsamkeiten und Unterschiede im Forschungsdatenmanagement der Primärerhebung und der Sekundäranalyse diskutiert. Aufbauend darauf unterbreiten wir in Abschnitt 8.3 einen Vorschlag zur einfachen Dokumentation der Erstellung von Forschungsdaten in der Sekundäranalyse im Rahmen einer Aufbereitungssyntax. Das Kapitel schließt mit einer kurzen Diskussion der Bedeutung und der Möglichkeiten des Forschungsdatenmanagements in der Sekundäranalyse (Abschnitt 8.4).https://doi.org/10.3224/84742233