Eine Plattform, viele Werkzeuge
Eine KI zu programmieren, ist ein aufwändiger Prozess: Unmengen von Daten müssen gesammelt, gesichtet und bewertet werden. Unsere Forschungsgruppe „Collaborative AI in Healthcare“ entwickelt eine Plattform, die alle wesentlichen Schritte integriert und die Zusammenarbeit von Programmierern und Medizinern erleichtert.
Künstliche Intelligenz (KI) wird in der Medizin zunehmend wichtig. Immer genauer können lernfähige Algorithmen Organe in CT- oder MRT-Bilddaten identifizieren oder bei Tumoren bestimmen, ob sie gutartig oder bösartig sind. Für den klinischen Alltag verspricht das neue Möglichkeiten: Beispielsweise können Diagnoseassistenten manch zeitraubende Routinearbeit erleichtern und den Workflow in Kliniken vereinfachen. Und Algorithmen für die Therapieplanung können Hinweise darauf liefern, ob und wie ein Patient ein bestimmtes Medikament verträgt.
Doch die Entwicklung solcher KI-Systeme bringt einige Herausforderungen mit sich. So muss die Software mit möglichst vielen, qualitativ hochwertigen Daten trainiert werden. Soll beispielsweise ein Programm eine bestimmte Region der Leber auf MRT-Aufnahmen zuverlässig erkennen und präzise vermessen, muss es zuvor mit zahlreichen von Ärzten markierten Bilddaten trainiert werden, auf denen zuvor die Leber eingezeichnet wurde. Zwar gibt es dafür schon diverse Programmier-Werkzeuge, aber diese greifen meist noch nicht gut ineinander. Deshalb arbeitet Fraunhofer MEVIS an einer kollaborativen KI-Plattform, die alle wesentlichen Werkzeuge vereint und die Zusammenarbeit der maßgeblichen Akteure – Programmierer und Mediziner – ermöglicht. „Unsere Plattform soll alles in einem System zusammenführen“, erläutert MEVIS-Informatiker Hans Meine. „Alle Beteiligten können sich in diese Plattform einloggen und dort sämtliche Arbeitsschritte ausführen.“
Qualitätssicherung mit eingebaut
Das beginnt beim Handling der Daten. So ist es heute in der Regel eine umständliche Handarbeit, die Daten aus einer Software zu exportieren und in eine andere zu importieren. Die neue Plattform soll diese Prozesse automatisieren und damit vereinfachen: Ähnlich wie eine professionelle Fotoverwaltungssoftware sammelt und katalogisiert sie die Datensätze und stellt sie übersichtlich dar.
Die Daten lassen sich – gegebenenfalls automatisch – nach ihrer Qualität bewerten, wobei Bilder von mangelhafter Güte aussortiert werden. Das Personal kann jeden Datensatz mit inhaltlichen Bemerkungen versehen, etwa was auf einer CT-Aufnahme zu erkennen ist und wie sich krankhafte Veränderungen bemerkbar machen. Dadurch fließt wertvolles medizinisches Wissen ein, mit dem der Computer seine erlernten Fähigkeiten laufend verfeinern kann.
„Ein Beispiel ist die Segmentierung, etwa wenn der Algorithmus versucht, bestimmte Regionen der Lunge automatisch zu erkennen“, erklärt Meines Kollegin Bianca Lassen-Schmidt. „Bemerkt der Mediziner, dass diese Segmentierung noch nicht so gut gelungen ist, kann er sie nachbearbeiten.“ Das korrigierte Bild geht dann als Trainingsdatensatz zurück in das Programm ein, wodurch sich der Algorithmus verbessern und genauere Resultate liefern sollte. „Dabei möchten wir natürlich sicherstellen, dass die Software nicht etwa schlechter wird“, sagt Lassen-Schmidt. „Das lässt sich vermeiden, indem man sie regelmäßig mit einem Testdatensatz überprüft.“ Erst wenn der Algorithmus diesen Test besteht, werden die angelernten Veränderungen übernommen – ein wichtiges Element der Qualitätssicherung.
Training in mehreren Kliniken
Eine weitere Herausforderung: Wird ein Algorithmus mit den Daten von nur einer Klinik trainiert, dürfte er womöglich auch nur dort funktionieren. Der Grund: Verschiedene Kliniken arbeiten mit unterschiedlichen Gerätschaften und Bildaufnahme-Protokollen. Dadurch können sich selbst für ein identisches Krankheitsbild die Datensätze subtil unterscheiden, was eine KI stärker verwirren kann als Menschen. Damit ein Algorithmus klinikübergreifend funktioniert, ist es wünschenswert, ihn mit den Daten aus möglichst vielen Krankenhäusern zu trainieren. Das aber wird durch den Datenschutz erschwert – Patientendaten sollen das Haus nach Möglichkeit nicht verlassen.
„Deshalb arbeiten wir daran, wie man einen Algorithmus mit den Daten aus verschiedenen Krankenhäusern trainieren kann, ohne dass diese Daten die Kliniken verlassen müssen“, erklärt Bianca Lassen-Schmidt. Die Strategie: Der Algorithmus beginnt sein Training in Klinik A, um es danach in Krankenhaus B fortzusetzen. Danach geht es wieder zurück in die erste Klinik, um die Prozedur weiter zu verfeinern. Da die Software bei jedem Schritt lediglich die gelernten Muster und keine Patientendaten „mitnimmt“, sollte der Datenschutz gewährleistet sein.
„Die Einzelkomponenten für unsere KI-Plattform haben wir bei Fraunhofer MEVIS im Großen und Ganzen bereits entwickelt“, sagt Hans Meine. „Jetzt sind wir dabei, sie zu einem Gesamtpaket zu schnüren, das wir dann gemeinsam mit unseren Partnern erproben können, etwa um klinische Studien durchzuführen.“ Und vielleicht kann die kollaborative Plattform langfristig sogar dazu beitragen, dass verschiedene Kliniken auch inhaltlich enger zusammenarbeiten. „Für die medizinische Forschung“, glaubt Bianca Lassen-Schmidt, „könnte das einen großen Effekt haben.“