Medical AI in der Hämatologie

Detektion von Patienten-Subtypen

Analyse genetischer Daten zur Bildung klinisch relevanter Patientencluster in der Hämatologie – von der explorativen AI-Analyse bis zum wiederverwendbaren Forschungsframework.
Detektion von Patienten-Subtypen

Aus umfangreichen genetischen Daten wurde eine AI-gestützte Analyse-Pipeline entwickelt, die bekannte und neue Patientengruppen in der hämatologischen Behandlung (AML) identifiziert und klinisch interpretierbar macht. Zum Einsatz kamen zahlreiche supervised und unsupervised Verfahren; über Meta-Clustering wurden die Ergebnisse stabilisiert und Hyperparameter automatisiert optimiert. Das Ergebnis sind neue, belastbare Patientencluster, die in wissenschaftlichen Publikationen aufgegriffen wurden, sowie ein wiederverwendbares Framework für künftige AI-gestützte Untersuchungen.

Herausforderungen

Genetische Daten sind hochauflösend, heterogen und hochdimensional, d.h. sie müssen in einen neuen Datenraum transponiert werden, um von Clustering-Verfahren überhaupt interpretierbar zu sein. Beide Schritte (Dimensionsreduktion und Clustering) bedeuten einen großen Parameterraum, was die Suche nach eine Lösung erschwert. Potentielle Lösungen müssen für Mediziner transparent und vergleichbar gemacht werden.

Lösungsansatz

Wir kombinierten viele Datenreduktions- und Lernverfahren (supervised/unsupervised) innerhalb einer modularen Pipeline. Ein nachfolgener Meta-Clustering-Ansatz aggregiert mehrere Clustering-Ergebnisse und liefert so stabile und robuste Ergebnisse. Die Hyperparameter-Optimierung erfolgt automatisiert über Variantenräume und Qualitätsmetriken. Ein Framework auf Python-Basis ermöglicht Kliniker:innen und Forschenden die interaktive Exploration des Lösungsraums, d.h. Filtern, Vergleich von Ergebnissen, Feature-Bedeutung und Export für die weiterführende Analyse. scikit-learn bildet den ML-Kern; Datenaufbereitung und -integration laufen über Pandas und Pandas/Profiling.

Ergebnis

  • Neue Patientencluster mit klaren molekularen Profilen, die als Grundlage für Hypothesenbildung und weitere Forschung dienen.
  • Wissenschaftliche Publikationen und Präsentationen, die die Ergebnisse und Methodik dokumentieren.
  • Ein Framework für zukünftige Untersuchungen, d.h. wiederverwendbar, erweiterbar und kliniknah bedienbar, inkl. klarer Schnittstellen für neue Datensätze und Verfahren.