Cookies 🍪

Diese Website verwendet Cookies, die Ihre Zustimmung brauchen.

Logo - NFDI4 DataScience

NFDI4DataScience

Kontakt
Employee photo Mr. Adamantios Koumpis
Adamantios Koumpis (Dr.) Forschungs- & Lehrbeauftragter
Projekt Status
laufend
Startdatum
March 10, 2026

Beschreibung

Die Vision von "Nationale Forschungsdateninfrastruktur for Data Science" (NFDI4DataScience, NFDI4DS) ist es, alle Schritte des komplexen und interdisziplinären Forschungsdatenlebenszyklus zu unterstützen, einschließlich der Erfassung/Erstellung, Verarbeitung, Analyse, Veröffentlichung, Archivierung und Wiederverwendung von Ressourcen in den Bereichen Datenwissenschaft und künstliche Intelligenz. In den letzten Jahren hat ein Paradigmenwechsel stattgefunden, bei dem computergestützte Methoden zunehmend auf datengesteuerten und oft auf Deep Learning basierenden Ansätzen beruhen, was zur Etablierung und Allgegenwart der Datenwissenschaft als einer Disziplin geführt hat, die von den Fortschritten im Bereich der Informatik angetrieben wird. Transparenz, Reproduzierbarkeit und Fairness sind aufgrund der Komplexität der heutigen datenwissenschaftlichen Methoden, die oft auf einer Kombination aus Code, Modellen und Daten für das Training beruhen, zu entscheidenden Herausforderungen für die Datenwissenschaft und künstliche Intelligenz geworden. NFDI4DS wird faire und offene Forschungsdateninfrastrukturen fördern, die alle beteiligten Ressourcen wie Code, Modelle, Daten oder Publikationen durch einen integrierten Ansatz unterstützen. Das übergeordnete Ziel von NFDI4DS ist die Entwicklung, Etablierung und Aufrechterhaltung einer nationalen Forschungsdateninfrastruktur (NFDI) für die Data-Science- und Künstliche-Intelligenz-Community in Deutschland. Dies wird auch einer breiteren Community zugutekommen, die Datenanalyselösungen innerhalb der NFDI und darüber hinaus benötigt. Die Kernidee besteht darin, die Transparenz, Reproduzierbarkeit und Fairness von Projekten in den Bereichen Datenwissenschaft und künstliche Intelligenz zu erhöhen, indem alle digitalen Artefakte verfügbar gemacht, miteinander verknüpft und innovative Tools und Dienste angeboten werden. Basierend auf der Wiederverwendung dieser digitalen Objekte werden so neue und innovative Forschungsarbeiten ermöglicht. NFDI4DS beabsichtigt, die Datenwissenschafts- und Künstliche-Intelligenz-Community in der Wissenschaft zu vertreten, einem interdisziplinären Bereich, der seine Wurzeln in der Informatik hat. Wir streben die Wiederverwendung bestehender Lösungen und eine enge Zusammenarbeit mit den anderen NFDI-Konsortien und darüber hinaus an. In der Anfangsphase wird sich NFDI4DS auf vier datenwissenschaftlich intensive Anwendungsbereiche konzentrieren: Sprachtechnologie, Biomedizin, Informationswissenschaften und Sozialwissenschaften. Das in NFDI4DS vorhandene Fachwissen stellt sicher, dass Metadatenstandards domänenübergreifend interoperabel sind und neue Wege im Umgang mit digitalen Objekten entstehen.

Kollaborationspartner

ZB MED
info@zbmed.de
Mehr erfahren
Fraunhofer-Gesellschaft Mehr erfahren
Leibniz Universität Hannover Mehr erfahren
Leibniz-Zentrum für Informatik
lzi@dagstuhl.de
Mehr erfahren
TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek Mehr erfahren
GESIS – Leibniz-Institut für Sozialwissenschaften Mehr erfahren
Technische Universität Berlin (TU Berlin) Mehr erfahren
RWTH Aachen University Mehr erfahren
Technische Universität Dresden Mehr erfahren
Universität Leipzig Mehr erfahren
DFKI - Deutsches Forschungszentrum für Künstliche Intelligenz
info@dfki.de
Mehr erfahren
FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur Mehr erfahren
ZBW – Leibniz-Informationszentrum Wirtschaft Mehr erfahren
Leuphana Universität Lüneburg Mehr erfahren

Publikationen

ELSA and the Data Scientist: A Qualitative Approach

2024 - Open Access -

Data Science (DS) and Artificial Intelligence (AI) are transforming research, industry and society at an unprecedented pace, enabling advances in areas such as healthcare, finance, e-commerce and beyond. Despite their potential, the rapid development and widespread use of DS and AI raise (novel) issues of reliability, accuracy, copyright and data protection, and bias and discrimination, among others, see for instance [1], [2], [3], [4]. It is therefore vital for data scientists to acknowledge the Ethical, Legal and Societal Aspects (ELSA) encountered in DS and AI projects, as this can promote critical thinking and reflection, thereby ensuring that data-driven systems and their underlying technologies are developed, deployed and used responsibly. In the framework of NFDI4DataScience, specifically in the Community and Training task area, we aim to develop ELSA guidelines for data scientists [5]. In order to achieve this objective, we tried to assess the landscape by conducting interviews with researchers and practitioners in the field, aiming to identify and analyse the most common ELSA challenges encountered in DS/AI projects and how to cope with them. The interviews were semi-structured interviews as this form is well suited to our purpose of collecting experiences, reflections and opinions from the participants [6]. A total of 30 were conducted between November 2022 and February 2024. The participants came mainly from academia, but the industry was also well represented. The application domains included a.o., healthcare, finance, engineering and digital humanities. In order to systematically interpret the material for manifest and latent meanings, we used qualitative content analysis [7]. Consequently, a categorisation of the material was developed to provide the basis for this interpretation [8, p. 33]. Initial categories were developed deductively, derived from the interview guide, which itself was based on existing theory and research. Subcategories were created inductively from the interviews following initial coding with the main categories. The categories reflected the key ELSA challenges faced by data scientists, including data protection, but also more specifically fairness, transparency, consent, intellectual property, and data scientists' knowledge (and also attitudes) towards ELSA challenges and how they influence their decision-making processes in the project. The results of our analysis reveal that data scientists are generally aware of ELSA issues, some more acutely than others; for example, legal issues, especially data protection, are more prominent, especially in application domains such as healthcare; bias is considered more during the data collection and less in connection to the model used or the system deployment; issues of transparency and explainability are also crucial although not prevalent. Insight was also provided regarding interdisciplinary cooperation, institutionalised ELSA support, and project documentation. Additionally, we have recorded critical assessments of the practices followed, spanning from issues with the application of laws to the responsibility and accountability of practitioners during a project life cycle. Finally, our findings emphasise the necessity of enhancing ELSA literacy and establishing and providing a strong foundational understanding of ethical and legal principles to data scientists. Developing recommendations/best practices for data scientists was regarded as a positive first step towards this goal

Ethical, Legal, and Societal Aspects of Data Science as manifested via a series of Interviews conducted within the framework of NFDI4DataScience, Study guide and anonymised transcripts

2025 - Open Access -

Dataset and Study Report

The upload consists of the two following files: 

  1. The study report on the Ethical, Legal, and Societal Aspects of Data Science, as manifested through a series of Interviews conducted within the framework of NFDI4DataScience Task Area 1: Community and Training. In the interviews, data science researchers and practitioners were asked to identify and analyse the most common legal and ethical challenges encountered in DS projects and how they address them. The objective was to use the collected information to create ELSA guidelines for Data Scientists. The file consists of the study guide itself and the following supplementary material:

    1. Call for participants email

    2. Call for participants email

    3. Email to the interviewees explaining the process

    4. Consent form template

    5. Anonymity Policy Clarification email

    6. Anonymisation Protocol

  2. The anonymized transcripts of the interviews