Options
October 9, 2025
Bachelor Thesis
Title
Generierung und Bewertung von Minderheitsdaten in klinischen Datensätzen mittels moderner GAN-Ansätze
Abstract
Diese Arbeit widmet sich der systematischen Untersuchung und Bewertung moderner GAN-Ansätze, die genau diesen Transfer-Learning-Ansatz verfolgen. Der Fokus liegt auf der Erzeugung tabellarischer Patientendaten, dem vorherrschenden Datenformat in EHR-Systemen. Hierfür werden zwei unterschiedliche Modelle gegenübergestellt: Das Conditional Tabular Generative Adversarial Network (CTGAN) und das RadialGAN. Das CTGAN wurde explizit für die komplexen Herausforderungen tabellarischer Daten konzipiert und verwendet Konditionierungs- und Sampling-Strategien (Xu u. a., 2019). Das RadialGAN hingegen nutzt einen Ansatz aus dem Bereich der Domänenadaption und wurde entwickelt, um Wissen aus mehreren Quelldatensätzen zu extrahieren und auf eine datenarme Zieldomäne zu übertragen (Yoon u. a., 2018). Obwohl beide Modelle in der Forschung bereits erfolgreich eingesetzt wurden, besteht eine Forschungslücke im direkten, systematischen Vergleich ihrer Leistungsfähigkeit für eine spezifische, aber in der Praxis zentrale Aufgabe: dem Wissenstransfer von einer datenreichen Mehrheitskohorte zu einer datenarmen Minderheitskohorte innerhalb eines einzigen Datensatzes. Ohne eine sorgfältige und mehrdimensionale Validierung besteht die Gefahr, dass die Modelle die Fehler der Trainingsdaten lediglich fortführen oder neue, vorher unbekannte Artefakte erzeugen, die zu Fehlinterpretationen führen können (Van Breugel u. a., 2023). Dies führt zur zentralen Forschungsfrage dieser Arbeit:
Kann durch Transfer Learning, beziehungsweise Domain Adaptation, die Datenbasis einer Minderheitsgruppe so erweitert werden, dass Modelle trotz Verteilungsverschiebung verlässlich lernen?
Kann durch Transfer Learning, beziehungsweise Domain Adaptation, die Datenbasis einer Minderheitsgruppe so erweitert werden, dass Modelle trotz Verteilungsverschiebung verlässlich lernen?
Thesis Note
Bonn, Hochschule, Bachelor Thesis, 2025
Author(s)