Research Data Management: Challenges in a Changing World
12. bis 14. März 2025 in Heidelberg und online
Veranstaltungsprogramm
Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.
|
Sitzungsübersicht |
Sitzung | ||
Präsentationen A2: Data Law
Sitzungsthemen: Datenrecht, Datenschutz, Datenethik und Datensicherheit, Künstliche Intelligenz, Lebenswissenschaften, Naturwissenschaften, Nicht zutreffend/Fachbereichsübergreifend
| ||
Präsentationen | ||
Unexpected Pitfalls in the field - Rechtliche Anforderungen an Einsatz von Machine Learning in der Agrosystemforschung FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur, Deutschland Das von der DFG geförderte Projekt FAIRagro baut ein FAIRes Forschungsdatenmanagement für die Community der Agrosystemforschung. Das Projekt umfasst mehrere Use Cases, welche sich mit dem Einsatzmöglichkeiten von Machine Learning auseinandersetzen. Dabei zeigen sich immer wieder überraschende rechtliche Probleme, auch, weil das rechtliche Umfeld sich in den letzten Jahren stark verändert hat. Dieser Vortrag soll einen Überblick über diese möglichen "Pitfalls" geben und aufzeigen, wie FAIRagro die Community bei der Lösung dieser Probleme unterstützt. Die rechtlichen Probleme lassen sich auf verschiedene „Lebensphasen“ eines ML-Modells aufteilen: Training, die Existenz des Modells selbst und sein schlussendlicher Einsatz. (Potentielle) Trainingsdaten können entweder schon nicht verfügbar sein oder aber rechtlichen Schranken unterliegen. Dann gilt es, Zugänge zu eröffnen und die Anforderungen (legitimer) Schranken zu entsprechen. Nicht zuletzt die DSGVO kann solche aufstellen (etwa bei geolokalisierten Messdaten), urheberrechtlich ergeben sich dabei Chancen aus der Schranke für Text- und Datamining, datenschutzrechtlich zumindest für manche Konstellationen aus der Forschungsprivilegierung. Zugänge können sich über Informationsgesetze ergeben, aber auch durch den neuen Data Act der EU. Auch spielen eher exotische Regelungen wie das Nagoya-Protokoll eine Rolle. Ein noch im Wachstum befindliches Feld ist der rechtliche Schutz der beim Training entstehenden Modelle. Dabei werden teilweise große Energiemengen aufgewendet. Auch bedarf es nicht unerheblicher menschlicher Leistung, sodass die Beteiligten ein Interesse daran haben, ihre Urheberrschaft anerkannt zu bekommen und eventuell auch daran, das weitere Schicksal der Modelle zu beeinflussen. Rechtlich bestehen dabei noch massive Unsicherheiten. Schließlich hat die EU mit der KI-Verordnung einen Rechtsrahmen für den Einsatz von Machine Learning Modellen gesetzt. Dieser unterteilt Modelle in verschiedene Risikokategorien und stellt an diese wiederrum verschiedene Anforderungen. Daraus ergeben sich für bestimmte Einsatzszenarien rechtliche Begrenzungen. Den rechtlichen Problemen gemeinsam ist ihre hohe Komplexität, die sich teilweise erst im Laufe des Vorhabens zeigt. Daher können Rechtsfragen vor Projektbeginn nicht erschöpfend abgehandelt werden, sondern es ist eine rechtliche Begleitung notwendig, welche zudem auf hohem Niveau arbeitet. Das auch aufgrund der Herausforderungen durch das neue EU-Datenrecht. FAIRagro setzt dabei auf das Modell des Data Steward Service Center (DSSC). Dieses unterstützt Forschende aus der Agrosystemcommunity bei auftretenden Problemen in allen Bereichen des Forschungsdatenmanagements - inklusive rechtlichen und ethischen Themen. Dieses Modell kann auch Vorbild für andere Forschungsdatencommunities sein. Research Data Management in Medical Data Science: Integrating Multi-Source Data for Cardiological Simulations and Machine Learning: Challenges in Security, Privacy, and Legal Frameworks 1Karlsruhe Institute of Technology (KIT), Deutschland; 2FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur In the following contribution, we aim to highlight the challenges in the field of medical data science. The integration of multi-source data in medical data science is crucial for advancing electrophysiological simulations and machine learning. However, significant challenges exist related to security, privacy, and legal frameworks that must be addressed to harness its full potential. Effective simulations of the human heart require geometrical models, which can be derived from MRI or CT imaging through segmentation techniques, as well as functional models that encompass tissue properties like fibrosis. These models can also leverage electro-anatomical mapping—an advanced technique involving catheter insertion to capture heart geometry and conduction properties.To enhance the accuracy of these models, also called digital twins, that can be used to simulate electrocardiograms (ECGs), electronic health records (EHRs) that provide essential patient information can additionally be incorporated. The legal status of both the models and the ECGs simulated with them is an interesting question, as they do not directly contain patient data. In contrast to the in silico ECGs, machine learning (ML) algorithms can also be trained on ECGs directly measured from actual patients, combined with their EHR data to diagnose or predict heart diseases. Importantly, these algorithms once trained do not retain direct patient identifiers. They can enable predictive insights, such as arrhythmia risk or automating tasks like P-wave delineation in the ECG. However, the reliance on extensive patient data raises legal questions, particularly regarding compliance with privacy regulations, data protection laws, copyright, contract law, ethics, and AI regulatory requirements. To ensure ethical practices, researchers must implement technical and organisational measures in line with data minimization principles, conduct risk assessments, and protect the rights and freedoms of data subjects. By balancing regulatory compliance with maximising the potential of ML/AI technologies, we aim to create a framework that minimises risks to patients while enabling responsible innovation. Furthermore, as the field of information security evolves, researchers face new challenges that require heightened awareness of traditional protection paradigms (Confidentiality, Integrity, Availability - CIA). This includes risks such as the manipulation of medical data like ECGs. Within the framework of the Digital Transformation in Research (DiTraRe) project, we focus on developing best practices that enhance security awareness among researchers and provide guidance on navigating the legal landscape effectively. By establishing these best practices, we aim to equip researchers with the necessary tools to address these multifaceted challenges in medical data-driven research responsibly. |
Impressum · Kontaktadresse: Datenschutzerklärung · Veranstaltung: E-Science-Tage 2025 |
Conference Software: ConfTool Pro 2.8.105+CC © 2001–2025 by Dr. H. Weinreich, Hamburg, Germany |
