Direkt zum Inhalt

Jensen, U., Zenk-Möltgen, W., & Wasner, C. (2019). Metadatenstandards im Kontext sozialwissenschaftlicher Daten. In U. Jensen, S. Netscher, & K. Weller (Eds.), Forschungsdatenmanagement sozialwissenschaftlicher Umfragedaten (pp. 151–178). Verlag Barbara Budrich. https://doi.org/10.3224/84742233

Zusammenfassung

Die transparente und nachvollziehbare Dokumentation von Forschungsdaten und ihres Entstehungskontextes stellt einen wesentlichen Beitrag zu deren Auffindbarkeit, Verständlichkeit, Reproduzierbarkeit und langfristigen Nutzung dar. Werden z.B. in einem Datensatz die Antworten auf eine Frage numerisch codiert (z.B. 1 und 2), müssen Nutzende wissen, was diese Zahlen bedeuten (z.B. Ja und Nein), welcher Inhalt damit verbunden ist (z.B. „Sind Sie wahlberechtigt?“). Datenwerte in einem Datensatz sind nicht selbsterklärend. Sie sind vielmehr der Ausgangspunkt und das Objekt, das systematisch durch Metadaten beschrieben werden muss. Derartige Metadaten – vereinfacht verstanden als Informationen über Daten – erstrecken sich von Angaben zu einzelnen Fragen im Fragebogen, deren Antworten als Variablen erfasst werden, bis hin zu den Bedingungen, unter denen die Daten entstanden sind, z.B. durch eine Befragung im Rahmen einer Studie. Dieses Kapitel behandelt Metadatenstandards und Anwendungsbeispiele, die aufzeigen, welche Arten von Metadaten zur Dokumentation, Zitation sowie zum Auffinden von quantitativen Daten in Katalogen für Forschende in sozialwissenschaftlichen Forschungsprojekten von Bedeutung sind. Aus Sicht des Forschungsdatenmanagements thematisiert dieses Kapitel Metadaten konkret als Daten oder Informationen, die in strukturierter Form analoge oder digitale Forschungsdaten (Objekte) dokumentieren. Sie beschreiben, erklären, verorten oder definieren Objekte, Ressourcen und Informationsquellen für die Wissenschaft. Hierdurch helfen sie, Forschungsdaten zu managen, zu erschließen, zu verstehen und zu benutzen (NISO, 2004). (Jensen/Katsanidou/Zenk-Möltgen 2011: 83) Forschende kommen dabei sowohl als Datenproduzierende als auch als Datennutzende auf unterschiedliche Weise – direkt oder indirekt – mit dem Thema Metadaten in Berührung. Suchen Datennutzende etwa Daten für Sekundäranalysen, greifen sie wahrscheinlich auch auf Datenkataloge zu, um in den dort angebotenen Metadaten zu suchen. Datenproduzierende brauchen wiederum Metadaten, um etwa die Variablen des Datensatzes zur internen Qualitätssicherung und für die Nachnutzung nach Projektende transparent und verständlich zu dokumentieren. Darüber hinaus sind Metadatenstandards für Dateninfrastrukturen (Archive, Repositorien etc.) von großer Bedeutung, um Forschungsdaten systematisch, standardisiert, nachhaltig und miteinander kompatibel zu managen. Um Archivierungssysteme und Datenkataloge in solchen Infrastrukturen sachgerecht zu entwickeln, nutzerfreundlich anzubieten und mit anderen Katalogen zu verbinden, setzen die Anbieter – je nach spezifischen Zweck – unterschiedliche Zusammenstellungen von Metadatenelementen eines Metadatenstandards, sogenannte Metadatenschemata, ein. Metadatenschemata durchlaufen diverse Entwicklungsphasen, aus denen sich mehr oder weniger verbindliche De-facto- oder Quasi-Standards entwickeln, die auf disziplinspezifischen Praxiserfahrungen und anerkannten Regeln einer wissenschaftlichen Community beruhen. Metadatenstandards können den Status einer Norm erhalten, wie z.B. die ISO-Norm 15836 des Dublin Core Metadata Element Set (DCMES 2012). Die Dublin Core Metadata Initiative (DCMI) entwickelt diesen Standard seit 1994: Waren die Metadaten des Dublin Core Standard zunächst auf die Suche nach Literaturdokumenten und bibliotheksnahe Dienste ausgerichtet, dienen sie heute allgemein der Erschließung von digitalen Objekten im Internet. Im Laufe der Zeit wurde das Metadatenschema von anderen Disziplinen aufgegriffen, um ihre Objekte, wie z.B. Forschungsdaten, im Web leichter auffindbar zu machen. Allerdings ist es nicht vorgesehen, mit Hilfe des Dublin Core Standard sehr kleinteilige und semantisch reichhaltige Aussagen über Forschungsdaten disziplinspezifisch zu dokumentieren. Für diese Zwecke entwickelte und etablierte sich ab Mitte der 1990er Jahre das offene Datenmodell der Data Documentation Initiative (DDI) als de-facto-Standard zur Dokumentation sozialwissenschaftlicher Forschungsdaten. Ausgehend von den vielfältigen Kontextinformationen, Datenelementen und Datenstrukturen in den Sozialwissenschaften, die durch das Datenmodell definiert werden, ermöglichen entsprechend modellierte DDI-Metadatenstrukturen eine umfassende und differenzierte Beschreibung von Forschungsdaten und deren Entstehungskontext. Metadatenelemente und Metadatenstrukturen und ein zugrunde liegendes Datenmodell stellen, vereinfacht gesagt, den DDI-Metadatenstandard dar, auch kurz DDI Standard genannt. Das vorliegende Kapitel behandelt sozialwissenschaftlich relevante Metadatenstandards, die Forschungsprojekte darin unterstützen sollen, in Kooperationen mit Dateninfrastrukturen und in Arbeitsteilung mit professionellen Datenmanager/innen ihre Forschungsdaten, Begleitdokumentationen und Projektinformationen • systematisch, transparent und nachvollziehbar zu dokumentieren, • zu registrieren und durch Identifikatoren dauerhaft zu zitieren bzw. zu identifizieren, • in nationalen und internationalen Datenkatalogen und Bibliotheksbeständen zu finden und • für Replikationen zu sichern bzw. langfristig für die Nachnutzung bereitzustellen. Die Bearbeitung des Themas erfolgt aus drei Perspektiven, denen jeweils ein Abschnitt in diesem Kapitel gewidmet ist. Abschnitt 9.1 dient der Einführung in das Thema Metadatenstandards und stellt zentrale Begriffe und Konzepte im sozialwissenschaftlichen Kontext vor. Anschließend wird der sozialwissenschaftlich relevante DDI Standard in seinen aktuellen Versionen behandelt. Abschnitt 9.2 erörtert Metadatenstandards zur Auffindbarkeit von elektronischen Ressourcen (Dublin Core Standard), zur Zitation von Datensätzen (DataCite Standard) und zur Dokumentation von sozialwissenschaftlichen Daten auf Studienebene (DDI Standard). Abschließend wird die Frage der Interoperabilität von Metadaten und deren praktischen Nutzen bei Recherchen in Datenkatalogen aus unterschiedlichen Anwendungskontexten erörtert. Diese Diskussion richtet sich primär an Mitarbeitende in Forschung, Lehre und Infrastrukturen, die allgemein an der Nutzung von Metadatenstandards beim Umgang mit sozialwissenschaftlichen Forschungsdaten interessiert sind. Analog widmet sich Abschnitt 9.3 den verschiedenen Aspekten von Metadaten bei der Dokumentation von Forschungsdaten auf Variablenebene. Dazu wird auf Eigenschaften gängiger Software eingegangen und ihre Fähigkeit zur Erfassung von Metadaten ausgelotet. Außerdem wird beschrieben, wie Metadaten zwischen umfragebasierten Systemen ausgetauscht werden können. Schließlich werden die Möglichkeiten des DDI-Standards zur Variablendokumentation behandelt und die relevanten Module und ihre Metadaten vorgestellt. Abschnitt 9.4 verweist auf ausgewählte Software und Dateiformate zur Verarbeitung und Präsentation von Metadaten. Diese beiden letzten Abschnitte unterstützen den sozialwissenschaftlichen Projektalltag, indem sie über den Umgang mit Metadaten bei der Dokumentation von Variablen und Fragen informieren. Schließlich werden Optionen behandelt, die es Projekten ermöglichen, Metadaten auf Studienebene und auf Variablenebene DDI kompatibel zu erfassen und bereitzustellen.

https://doi.org/10.3224/84742233