Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nur Sitzungen am Veranstaltungsort 
 
 
Sitzungsübersicht
Sitzung
Präsentationen C4: Nachnutzung
Zeit:
Donnerstag, 13.03.2025:
14:20 - 15:00

Chair der Sitzung: Maximilian Heber
Ort: 1. Obergeschoss, Hörsaal 08
Virtuelle Bühne für Hörsaal 8

Sitzungsthemen:
Datenpublikation, Open Data, Open Science, Open Access, Datenformate und -standards, Datenarchivierung, Reproduzierbarkeit und Nachnutzung, NFDI-Bezug, Naturwissenschaften

Zeige Hilfe zu 'Vergrößern oder verkleinern Sie den Text der Zusammenfassung' an
Präsentationen

Staatliche Daten für die Forschung nutzbar machen: Ein Leitfaden zur offenen und FAIRen Bereitstellung

Ivonne Anders1, Frank Kaspar2, Frank Kratzenstein2, Martin Schupfner1, Hannes Thiemann1

1Deutsches Klimarechenzentrum, Deutschland; 2Deutscher Wetterdienst, Deutschland

Staatliche Organisationen erfassen und verwalten eine Vielzahl unterschiedlicher Datentypen auf verschiedenen Ebenen, um ihre offiziellen Aufgaben zu erfüllen. Dazu zählen geografische, umweltbezogene, meteorologische, demografische, gesundheitsbezogene, verkehrs-, transport-, finanz- und wirtschaftsbezogene Daten. Der Zugang zu diesen Daten war traditionell stark eingeschränkt. Doch in den vergangenen zehn Jahren hat sich global ein Trend zu einer offeneren Datenpolitik entwickelt, der durch Richtlinien wie GeoIDG, die PSI-Richtlinie und INSPIRE gefördert wurde. Auch in Deutschland haben die Bundesländer und ihre Behörden eine Politik der offenen Daten eingeführt und stellen einige dieser Daten über Plattformen wie Destatis oder GDI-DE der Öffentlichkeit zur Verfügung (Open Government Data). Diese Daten dienen einer Vielzahl von Zwecken, darunter die Standortbestimmung, die Analyse von Umwelttrends, die Verkehrsplanung, die Gesundheitsplanung und mehr. Obwohl diese Daten zunehmend für wissenschaftliche Forschung genutzt werden, bleibt ihr volles Potenzial – insbesondere bei großen Datensätzen – oft ungenutzt. Trotz der hohen Qualität der Behördendaten ist eine weitere Anpassung an die FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) erforderlich, um ihre Wiederverwendbarkeit für die Forschung zu verbessern.

Datenschutzbestimmungen und rechtliche Rahmenbedingungen können dabei jedoch Einschränkungen auferlegen, die eine Anonymisierung der Daten oder die Einhaltung moderner Datenstandards notwendig machen. Nichtsdestotrotz stellen staatliche Daten eine wertvolle Ressource dar, die wesentlich zur Wissensvermehrung in allen wissenschaftlichen Disziplinen beiträgt.

Im Rahmen eines von NFDI4Earth geförderten Pilotprojekts haben der Deutsche Wetterdienst (DWD) und das Deutsche Klimarechenzentrum (DKRZ) gemeinsam daran gearbeitet, den Zugang zu Daten öffentlicher Stellen zu erleichtern, die Sichtbarkeit dieser Daten zu erhöhen und die Nutzerzahl aus verschiedenen Disziplinen zu steigern. Ziel war es, die Daten in standardisierten und FAIR-konformen Formaten für die Forschung sowie für andere öffentliche Anwendungen bereitzustellen. Als Anwendungsbeispiel wurde der COSMO-REA6-Reanalysedatensatz des DWD (Kaspar et al. 2020) ausgewählt, der für Klimamodellierung, Analysen und Energieanwendungen in Europa von zentraler Bedeutung ist. Der Standardisierungsprozess umfasste die Überführung von behördlichen Datenstandards in domänenspezifische Standards der Klimaforschung und erforderte eine enge Zusammenarbeit zwischen DWD und DKRZ. Nach einer sorgfältigen Kuratierung und Qualitätsprüfung wurde der Datensatz über die ESGF-Infrastruktur zugänglich gemacht und langfristig im WDCC archiviert, wobei Aspekte der Lizenzierung und Urheberschaft berücksichtigt wurden.

Die im Projekt gewonnenen Erkenntnisse und Erfahrungen wurden in ein Konzept überführt, das als Leitfaden dafür dient, wie Daten anderer Behörden für die Forschung und die Öffentlichkeit besser zugänglich und nutzbar gemacht werden können. Der gesamte Prozess kann in fünf Teilschritte unterteilt werden: (1) Bedarfsermittlung und -klassifizierung, (2) Machbarkeitsanalyse, (3) Umsetzung, (4) Feedback und Nachbereitung sowie (5) Verbreitung. Dieser Entwurf skizziert allgemeingültige Schritte und Aspekte, die für alle Bereiche und Mitarbeitenden anwendbar sind und bietet einen Rahmen zur Optimierung der Nutzung von Behördendaten in verschiedenen Bereichen.

Referenzen

Kaspar, F., et al., 2020: Regional atmospheric reanalysis activities at Deutscher Wetterdienst: review of evaluation results and application examples with a focus on renewable energy, Adv. Sci. Res., 17, 115–128, https://doi.org/10.5194/asr-17-115-2020, 2020.



Advancing Climate Data Reusability through FAIR Digital Objects and decentralized Technologies

Marco Kulüke, Ivonne Anders, Karsten Peters-von Gehlen

Deutsches Klimarechenzentrum, Deutschland

Climate science relies heavily on the effective creation, management, sharing, and analysis of massive and diverse datasets. As the digital landscape evolves, there is a growing need to establish a framework that ensures FAIRness in handling climate science digital objects. Especially, the machine-to-machine actionability of digital objects will be a crucial step towards future AI assisted workflows. Motivated by a use case, this contribution proposes the adoption of the Fair Digital Object (FDO) concept to address the challenges associated with the emerging spread in interdisciplinary reuse scenarios of climate model simulation output, as well as observational data.

FDOs are encapsulations of data and their metadata made accessible via persistent identifiers (PIDs) in a way that data and their context will remain a complete unit as FDO travels through cyberspace and time. They represent a paradigm shift in data management, emphasizing the machine-actionability principles of FAIRness and the requirements enabling cross-disciplinary research. The FDO concept can be applied to various digital objects, including data, documents and software within different research disciplines and industry areas.

The aim of this work is to commit to an FDO standard in climate science that enables standardized and therefore automated data analysis workflows and facilitates the extraction and analysis of relevant weather and climate data by all stakeholders involved. The current work expands on the efforts made to enable broad reuse of CMIP6 climate model data and focuses on requirements identified to enable automated processing of climate simulation output and their possible implementation strategies. In doing so, we propose the following concrete avenues: (1) Enriching the PID profiles of climate model and observational data in accordance with the FDO concept while taking into account the needs of the climate science community will lead to improved findability of digital objects, especially for machines. (2) Adopting the FDO concept for existing data management solutions, such as intake-esm and Spatio Temporal Asset Catalogs (STAC), can lead to improved data handling in line with prevailing community practices. (3) Furthermore, combining the FDO concept with the Inter Planetary File System (IPFS) offers benefits, such as decentralized storage, improved data integrity and easier data sharing through content addressing of digital objects.

Eventually, implementing an FDO standard will benefit climate science as well as related communities in several ways: The reusability of the data will facilitate the cost-effective use of existing economically expensive climate model and observational data. Also, these approaches will lead to higher transparency and will increase the reproducibility of research workflows and consolidate scientific results.



 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: E-Science-Tage 2025
Conference Software: ConfTool Pro 2.8.105+CC
© 2001–2025 by Dr. H. Weinreich, Hamburg, Germany