Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
 
Präsentationen mit dem Text „Perspektiven aus Praxis und Wissenschaft auf die Zitierung von Forschungsdatensätzen - wie wird Datennutzung nachgewiesen?“

Perspektiven aus Praxis und Wissenschaft auf die Zitierung von Forschungsdatensätzen - wie wird Datennutzung nachgewiesen?

Dorothea Strecker1, Felix Bach2, Kerstin Soltau2

1Institut für Bibliotheks- und Informationswissenschaft, Humboldt-Universität zu Berlin; 2FIZ Karlsruhe - Leibnizinstitut für Informationsinfrastruktur

Das Forschungsdatenmanagement verfolgt zwei zentrale Ziele: Die Verbesserung der Nachvollziehbarkeit und die Nachnutzung von Forschungsergebnissen. In beiden Fällen wird die formelle Referenzierung von (nach-)genutzten Datensätzen, die "Datenzitation", empfohlen. Forschungsdatenrepositorien können diese Praktik durch verschiedene Maßnahmen unterstützen, etwa durch die Registrierung von DOIs für Datensätze, die Angabe von Zitationen in Metadaten, oder die Integration von Prozessen in bestehende Publikationsworkflows. Repositorien können ein Interesse an der Zitierung von Datensätzen haben, etwa um einzelne Datensätze für potentielle Nachnutzende zu kontextualisieren oder um die eigene Leistung zu evaluieren. Dies ist auch im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) zunehmend bedeutsam, um den Erfolg aufgebauter Infrastrukturen und deren Nutzung quantitativ belegen zu können. Die Literatur zeigt jedoch, dass die Praxis der formalen Zitierung von Forschungsdaten noch nicht flächendeckend etabliert ist, Standards für Ermittlung und Nachweis der Kennzahlen noch nicht zur Verfügung stehen und wirksame Anreizsysteme fehlen.

Der Vortrag ist als Tandem-Talk konzipiert und beginnt mit der Perspektive des Forschungsdatenrepositoriums RADAR von FIZ Karlsruhe auf die Zitierung von Datensätzen.

RADAR hat derzeit bereits eine Vielzahl an Maßnahmen implementiert, die die Nachnutzung und Zitation von Forschungsdaten fördern. Diese zielen darauf ab, die Sichtbarkeit und Zugänglichkeit von Datenpublikationen für die wissenschaftliche Gemeinschaft zu maximieren. Hierzu zählen z. B. die Verwendung standardisierter Metadaten inkl. DOI und verwandter Identifikatoren, die Empfehlung offener Lizenzen, die langfristige Verfügbarkeit der Daten sowie die Reichweite und disziplinübergreifende Auffindbarkeit der Metadaten, beispielsweise durch Indexierung in wissenschaftlichen Suchmaschinen bzw. Aggregatoren. Die korrekte Zitation wiederum wird durch Listung verschiedener Zitationsstile auf der Landingpage eines RADAR-Datensatzes erleichtert. Inwiefern diese Möglichkeit für Datenzitationen genutzt wird, ist für RADAR jedoch aktuell nicht nachverfolgbar.

Im zweiten Teil wird untersucht, wie häufig und in welcher Form Datensätze, die über RADAR publiziert wurden, zitiert werden. Zu diesem Zweck werden die offenen Datenquellen Event Data und der Data Citation Corpus zusammengeführt und um DOI-Metadaten sowie Nutzungsstatistiken ergänzt.

Die Auswertung am Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin zeigt, dass ein Teil der Datensätze im Repositorium mindestens einmal zitiert wurden. Die Zitationsrate wird zur besseren Einordnung mit anderen Repositorien verglichen. Eine eingehende Betrachtung der RADAR-Datensätze zeigt, dass die Zitierung verschiedenen Zwecken dient, und dass die Granularität von Datensätzen einen Einfluss auf Zitationshäufigkeiten hat. Fast die Hälfte der zitierten Datensätze werden mehr als einmal zitiert. Die Mehrzahl der Zitierungen ist jedoch nicht als Nachweis von Datennachnutzung im engeren Sinn zu verstehen, da sie von Publikationen der Autor*innen der Datensätze ausgeht. Die meisten Zitierungen erfolgen im selben Jahr wie die Veröffentlichung des zitierten Datensatzes. In einigen Fällen vergehen jedoch mehrere Jahre, bevor bereits publizierte Datensätze zitiert werden. Die Gruppen der zitierten und unzitierten Datensätze unterscheiden sich signifikant mit Blick auf die Zahl der Seitenaufrufe. Der Unterschied der Downloadzahlen der beiden Gruppen hingegen ist nicht signifikant.

Der Vortrag schließt mit einer Zusammenfassung und kritischen Reflektion der vorgestellten Ergebnisse und kontrastiert Perspektiven und Erwartungen aus Praxis und Wissenschaft. Es werden Problemfelder aufgezeigt, die die Nachnutzung von Forschungsdaten und die Belastbarkeit von Analysen von Datenzitationen aktuell noch einschränken und - wo möglich - Lösungsansätze skizziert.

Details zur Session:

Präsentationen C3: Nachnutzung
Zeit: 13.03.2025: 13:30-14:10 · Ort: 1. Obergeschoss, Hörsaal 08

 
 
 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: E-Science-Tage 2025
Conference Software: ConfTool Pro 2.8.105+CC
© 2001–2025 by Dr. H. Weinreich, Hamburg, Germany