Forschungsbericht 2013 - Max-Planck-Institut für Innovation und Wettbewerb

Informationsinfrastrukturen für Forschungsdaten: Das Projekt European Data Watch Extended

Autoren
Mueller-Langer, Frank
Abteilungen
Max-Planck-Institut für Innovation und Wettbewerb, München
Zusammenfassung
Wirtschaftswissenschaftler stellen ihre Forschungsdaten meist nicht proaktiv frei zur Verfügung, weder zur Förderung des wissenschaftlichen Diskurses noch zur Nachnutzung oder zu Replikationszwecken. Von dieser Beobachtung ausgehend untersuchen Forscher am Max-Planck-Institut für Innovation und Wettbewerb, welche Anreize es wahrscheinlicher machen, dass Daten doch freiwillig weitergegeben werden [1]. Eine Anstellung auf Lebenszeit und eine positive Einstellung gegenüber Open Science sind zwei mögliche Faktoren, die die Wahrscheinlichkeit der freiwilligen Weitergabe nachweisbar erhöhen.

Die Verfügbarkeit von publikationsbezogenen Forschungsdaten ist eine notwendige Voraussetzung, um bestehende Forschungsergebnisse zu überprüfen, zu bestätigen und zu erweitern. In der empirischen Wirtschaftsforschung gibt es aktuell allerdings kaum effektive Möglichkeiten, Forschungsdaten im Kontext der zugehörigen Textpublikationen zu Zwecken der Replikation, zur Nachnutzung oder zur Förderung des wissenschaftlichen Diskurses bereitzustellen oder nachzunutzen [2,3]. Ein Zeitschriftenaufsatz enthält häufig nur noch einen Teil der Informationen, die notwendig sind, damit die Forschungsergebnisse durch Dritte effektiv bewertet werden können [4]. Unberücksichtigt bleiben zumeist die exakte Dokumentation der benutzten Forschungs- beziehungsweise Statistikdaten, die Dokumentation zu den Daten, Bereinigungs- und Selektionsbefehle sowie die eingesetzten Softwareprogramme [5]. Daher hat sich das von der Deutschen Forschungsgemeinschaft (DFG) geförderte European Data Watch Extended (EDaWaX)-Projekt zum Ziel gesetzt, ein publikationsbezogenes Datenarchiv für wirtschaftswissenschaftliche Fachzeitschriften zu entwickeln, das diese Anforderungen erfüllt. Im Rahmen dieses Projekts untersuchen MCIER-Forscher die Anreizmechanismen für eine freiwillige und verpflichtende Weitergabe von publikationsbezogenen Forschungsdaten zur Förderung des wissenschaftlichen Diskurses, zur Nachnutzung sowie zu Replikationszwecken. EDaWaX verbindet wirtschaftswissenschaftliche Grundlagenforschung über Anreizmechanismen zur Förderung freiwilliger und verpflichtender Datenweitergabe mit infrastrukturpolitischen Elementen; diese sollen Forscherinnen und Forschern die Weitergabe publikationsbezogener Forschungsdaten und Fachzeitschriften die Pflege eines publikationsbezogenen Forschungsdatenarchivs erleichtern.

An diesem Projekt ist der Rat für Sozial- und Wirtschaftsdaten (RatSWD), das Munich Center for Innovation and Entrepreneurship Research (MCIER) in Kooperation mit der International Max Planck Research School for Competition and Innovation (IMPRS-CI) und die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) beteiligt.

Gegenwärtiger Stand des Datenweitergabeverhaltens in den Wirtschaftswissenschaften

Forscher am MCIER untersuchen das Datenweitergabeverhalten von fast 500 zufällig ausgewählten, empirisch arbeitenden Wirtschaftswissenschaftlern der international renommiertesten volkswirtschaftlichen (Top-100) und betriebswirtschaftlichen Fakultäten (Top-50). Dazu wurden ihre Internetauftritte und ihre Einträge in öffentlichen Forschungsdatenarchiven analysiert. Hierbei zeigte sich, dass nur knapp 2 Prozent der Forscherinnen und Forscher ihre publikationsbezogenen Forschungsdaten über Autorenwebseiten oder öffentliche Datenarchive proaktiv online anbieten, weitere 16 Prozent teilen ihre Forschungsdaten sporadisch. Folglich stellen über 80 Prozent der untersuchten Wissenschaftler die ihren Arbeiten zugrunde liegenden Forschungsdaten der wissenschaftlichen Gemeinschaft nicht proaktiv online zur Verfügung. Darüber hinaus unterstützen die Ergebnisse der empirischen Analyse folgende Hypothesen, die aus der theoretischen Literatur zur Informationsweitergabe in der Wissenschaft abgeleitet sind: Die Wahrscheinlichkeit der freiwilligen Weitergabe von Forschungsdaten steigt in signifikanter Weise für Forscher, die

a) eine Anstellung auf Lebenszeit innehaben,

b) gemessen an Zitationskennzahlen höherwertig publizieren [6],

c) häufiger in Fachzeitschriften mit Datenweitergaberegelungen publizieren und

d) eine positive persönliche Haltung gegenüber den Prinzipien frei verfügbarer Forschung (Open Science) haben.

Daraus schließen die MCIER-Forscher, dass es zwar eine Nachfrage nach frei verfügbaren publikationsbezogenen Forschungsdaten gibt, aber kein entsprechendes Angebot. Deshalb müssten Universitäten, wissenschaftliche Fachzeitschriften und Forschungsförderer bestehende institutionelle Anreizmechanismen zur Förderung der Weitergabe von Forschungsdaten weiter ausbauen.

Vor diesem Hintergrund konzentrieren sich MCIER-Forscher in einem weiteren Arbeitsschritt darauf, die Anreizeffekte verpflichtender Regelungen für die Weitergabe von Daten wissenschaftlicher Fachzeitschriften zu analysieren.

Theoretische Analyse der Anreiz- und Wohlfahrtseffekte von Datenweitergaberegelungen

Welche Anreize existieren für Forscher, ihre Daten konkurrierenden Wissenschaftlern zur Verfügung zu stellen? Dazu wird in einem theoretischen, wirtschaftswissenschaftlichen Modell zwischen zwei Szenarien unterschieden.

Erstens: Unter einem Zwang zur Datenweitergabe, wie ihn zum Beispiel renommierte Fachzeitschriften wie American Economic Review oder Econometrica verfolgen, müssen Autorinnen und Autoren den Datensatz zeitgleich mit der ersten Publikation, in der dieser verwendet wird, frei zugänglich machen. Zweitens: Im Fall einer freiwilligen Datenweitergabe können Autoren selbst entscheiden, ob und zu welchem Zeitpunkt der publikationsbezogene Datensatz frei zugänglich gemacht wird. Erste Ergebnisse dieser theoretischen Analyse deuten darauf hin, dass die Einführung eines Zwangs zur Datenweitergabe zu einer strategischen Verzögerung von Publikationen führen kann, wenn der Wert einer weiteren Publikation als Alleinautor sehr hoch ist, der Datensatz nur langsam an Wert verliert und den Autoren zukünftige Publikationen annähernd genauso wichtig sind wie gegenwärtige Publikationen. In diesem Fall hat ein Zwang zur Datenweitergabe einen eindeutig negativen Einfluss auf die soziale Wohlfahrt.

Dies führt zu dem Schluss, dass die Anreize, Daten zur Verfügung zu stellen, erhöht werden müssen, um strategische Verzögerungen zu vermeiden. Diese Anreize könnten beispielsweise durch Zitation der Urheber von Datensätzen, „Daten-Koautorenschaften“, Reputationsgewinne durch Replizierbarkeit der Forschungsergebnisse sowie zusätzliche Forschungsmittel für die Datenbereitstellung durch Universitäten oder Forschungsförderinstitutionen gesetzt werden.

Literaturhinweise

Andreoli-Versbach, P.; Mueller-Langer, F.
Open access to data: An ideal professed but not practised
Research Policy, forthcoming; Preliminary version available at: http://ssrn.com/abstract=2272027 RatSWD Working Paper No. 215 (2013)
Vlaeminck, S.
Data management in scholarly journals and possible roles for libraries: Some insights from EDaWaX
LIBER Quarterly 23 (1), 48–79 (2013)
Vlaeminck, S.; Wagner, G. G.; Wagner, J.; Harhoff, D.; Siegert, O.
Replizierbare Forschung in den Wirtschaftswissenschaften erhöhen – eine Herausforderung für wissenschaftliche Infrastrukturdienstleister
LIBREAS. Library Ideas 23, 29–42 (2013)
Buckheit, J. B.; Donoho, D. L.
WaveLab and Reproducible Research
In: Wavelets and Statistics, 53–81 (Eds. Antoniadis, A.; Oppenheim, G.). Springer, New York (1995)
Baiocchi, G.
Reproducible research in computational economics: Guidelines, integrated approaches, and open source software
Computational Economics 30 (1), 19–40 (2007)
Mueller-Langer, F.; Gerstenberger, M.; Hackinger, J.; Heisig, B.
A brief guide for the creation of author-specific citation metrics and publication data using the Thomson Reuters Web of Science and Scopus Databases
RatSWD Working Paper No. 228 (2013)
Zur Redakteursansicht