Anwendungsschwerpunkt Synthetische Datengenerierung
Vision
Unsere Vision ist es, die Nutzung medizinischer Daten grundlegend zu verändern, indem wir die Generierung hochqualitativer synthetischer Daten vorantreiben, die reale klinische Studiendaten detailgetreu nachbilden. Durch den Einsatz fortschrittlicher KI-Architekturen wie GANs, VAEs und Transformern streben wir eine Zukunft an, in der der Datenaustausch nahtlos, sicher und datenschutzkonform erfolgt. Unser Ziel ist es, den Zugang zu wertvollen medizinischen Daten zu erleichtern und gleichzeitig strenge Anonymisierungsstandards einzuhalten, um Innovationen im Bereich der Gesundheits-KI voranzutreiben.
Unsere Hauptaufgabe besteht darin, hochentwickelte KI-basierte Techniken zu entwickeln und einzusetzen, um synthetische tabellarische Daten für medizinische Datensätze zu erzeugen. Durch den Einsatz modernster Modelle wie GANs, VAEs und Transformern synthetisieren wir Daten, die nicht nur den Datenschutz der Patienten gewährleisten, sondern auch die Integrität und den Nutzen der Informationen sicherstellen.
Ein entscheidender Aspekt unserer Arbeit ist das Rebalancing von Datensätzen durch intelligentes Oversampling, um Probleme mit unausgeglichenen Daten zu beheben und die Leistungsfähigkeit von KI-Algorithmen zu verbessern. Dadurch ermöglichen wir genauere, verlässlichere und gerechtere KI-basierte Erkenntnisse im medizinischen Bereich und fördern Fortschritte in der Forschung, Diagnostik und Patientenversorgung.
Schwerpunkte
- Entwicklung und Einsatz KI-basierter Techniken zur Erzeugung synthetischer tabellarischer Daten für medizinische Datensätze
- Einsatz modernster Modelle wie GANs, VAEs und Transformer zur Datensynthese
- Sicherstellung des Datenschutzes der Patienten sowie der Integrität und des Nutzens der Informationen
- Rebalancing von Datensätzen durch sog. Oversampling, um Probleme unausgeglichener Daten zu beheben
Kontakt
Ausgewählte Projekte
- ScaDS.AI - Erstellung von tabellarischen Daten in der Medizin
Ausgewählte Publikationen
- Eckardt et al. Mimicking clinical trials with synthetic acute myeloid leukemia patients using generative artificial intelligence (2024)
- Salybekov et al. Artificial Intelligence Reporting Guidelines’ Adherence in Nephrology for Improved Research and Clinical Outcomes (2024)
- Ahmadi et al. A comparative patient-level prediction study in OMOP CDM: applicative potential and insights from synthetic data (2024)
- Schultz et al. ConvGeN: A convex space learning approach for deep-generative oversampling and imbalanced classification of small tabular datasets (2024)