• English
  • Deutsch
  • Log In
    Password Login
    Research Outputs
    Fundings & Projects
    Researchers
    Institutes
    Statistics
Repository logo
Fraunhofer-Gesellschaft
  1. Home
  2. Fraunhofer-Gesellschaft
  3. Abschlussarbeit
  4. Generierung und Bewertung von Minderheitsdaten in klinischen Datensätzen mittels moderner GAN-Ansätze
 
  • Details
  • Full
Options
October 9, 2025
Bachelor Thesis
Title

Generierung und Bewertung von Minderheitsdaten in klinischen Datensätzen mittels moderner GAN-Ansätze

Abstract
Diese Arbeit widmet sich der systematischen Untersuchung und Bewertung moderner GAN-Ansätze, die genau diesen Transfer-Learning-Ansatz verfolgen. Der Fokus liegt auf der Erzeugung tabellarischer Patientendaten, dem vorherrschenden Datenformat in EHR-Systemen. Hierfür werden zwei unterschiedliche Modelle gegenübergestellt: Das Conditional Tabular Generative Adversarial Network (CTGAN) und das RadialGAN. Das CTGAN wurde explizit für die komplexen Herausforderungen tabellarischer Daten konzipiert und verwendet Konditionierungs- und Sampling-Strategien (Xu u. a., 2019). Das RadialGAN hingegen nutzt einen Ansatz aus dem Bereich der Domänenadaption und wurde entwickelt, um Wissen aus mehreren Quelldatensätzen zu extrahieren und auf eine datenarme Zieldomäne zu übertragen (Yoon u. a., 2018). Obwohl beide Modelle in der Forschung bereits erfolgreich eingesetzt wurden, besteht eine Forschungslücke im direkten, systematischen Vergleich ihrer Leistungsfähigkeit für eine spezifische, aber in der Praxis zentrale Aufgabe: dem Wissenstransfer von einer datenreichen Mehrheitskohorte zu einer datenarmen Minderheitskohorte innerhalb eines einzigen Datensatzes. Ohne eine sorgfältige und mehrdimensionale Validierung besteht die Gefahr, dass die Modelle die Fehler der Trainingsdaten lediglich fortführen oder neue, vorher unbekannte Artefakte erzeugen, die zu Fehlinterpretationen führen können (Van Breugel u. a., 2023). Dies führt zur zentralen Forschungsfrage dieser Arbeit:
Kann durch Transfer Learning, beziehungsweise Domain Adaptation, die Datenbasis einer Minderheitsgruppe so erweitert werden, dass Modelle trotz Verteilungsverschiebung verlässlich lernen?
Thesis Note
Bonn, Hochschule, Bachelor Thesis, 2025
Author(s)
Elmer, Jonas
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI  
Advisor(s)
Jacobs, Marc  
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI  
Becker, Peter
Hochschule Bonn-Rhein-Sieg  
Language
German
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI  
Keyword(s)
  • Generative Adversarial Network

  • synthetische Daten

  • Diabetes 130-US Hospitals

  • Cookie settings
  • Imprint
  • Privacy policy
  • Api
  • Contact
© 2024