Künstliche Intelligenz erreicht Menschen in der Brustkrebsdiagnose

Künstliche Intelligenz erreicht Niveau von Menschen in der Brustkrebsdiagnose

Eine wegweisende Studie zeigt, dass ein Deep-Learning-System Brustkrebs in Mammogrammen genauso gut erkennen kann wie erfahrene Radiologen.

Neuigkeiten: Forscher der Lund University in Schweden führten eine randomisierte (zufällige), kontrollierte klinische Studie durch, um herauszufinden, ob ein KI-System Radiologen Zeit sparen kann, ohne dabei die Patienten zu gefährden. Dies war angeblich die erste Studie zur Fähigkeit von KI, Brustkrebs in Mammogrammen zu diagnostizieren, deren Design dem sogenannten Goldstandard für medizinische Tests entspricht. Durch ihr Verfahren, bei dem Mensch und Maschine zusammenarbeiten, konnten Radiologen pro Patient deutlich weniger Zeit aufwenden und dabei den Basissicherheitsstandard übertreffen.

Wie funktioniert es: Die Autoren teilten zufällig 80.000 schwedische Frauen in eine Kontrollgruppe und eine Experimentiergruppe auf.

  • Die Kontrollgruppe ließ ihre Mammogramme manuell von zwei Radiologen auswerten (die Standardpraxis in weiten Teilen Europas).
  • Die Experimentiergruppe ließ ihre Mammogramme von Transpara auswerten, einem faltenden neuronalen Netzwerk, das darauf trainiert ist, Brusttumore zu erkennen. Transpara bewertete die Mammogramme auf einer Skala von 1 (geringes Risiko) bis 10 (hohes Risiko) hinsichtlich des Krebsrisikos. Bei Mammogrammen, die 8 bis 10 Punkte erzielten, wurden Markierungen gesetzt, um potenzielle Krebsstellen hervorzuheben.
  • Menschliche Radiologen bewerteten die Mammogramme, Bewertungen und Markierungen der Experimentiergruppe. Ein Radiologe überprüfte jedes Mammogramm, es sei denn, Transpara hatte eine Bewertung von 10 zugewiesen, in diesem Fall überprüften zwei Radiologen es. Somit untersuchte mindestens ein Radiologe jeden Patienten in der Studie.
  • Schließlich entschieden die Radiologen, ob sie jeden Patienten zur weiteren Untersuchung einbestellen oder nicht. Dadurch konnten sie falsch positive Ergebnisse erkennen.

Ergebnisse: Die KI-unterstützte Diagnose erreichte eine Krebserkennungsrate von 6,1 pro 1.000 untersuchten Patienten, vergleichbar mit der Kontrollmethode und über einer etablierten Sicherheitsgrenze. Die Radiologen bestellten 2,0 Prozent der Kontrollgruppe und 2,2 Prozent der Experimentalgruppe zur weiteren Untersuchung ein, und die Falsch-Positiv-Rate war mit 1,5 Prozent in beiden Gruppen gleich. (Der Unterschied in den Einbestellungsraten und die gleiche Falsch-Positiv-Rate deuten darauf hin, dass die KI-Methode 20 Prozent mehr Krebsfälle entdeckte als die manuelle Methode, obwohl die Autoren dies nicht betonen). Darüber hinaus wurden etwa 37.000 Patienten nur von einem Radiologen untersucht, was darauf hindeutet, dass die KI 44,3 Prozent der Untersuchungsarbeit einsparte, ohne die Zahl der falsch diagnostizierten Patienten zu erhöhen.

Ja, aber: Die Methode der Autoren erfordert weitere Studien, bevor sie in die klinische Praxis umgesetzt werden kann, z. B. die Beobachtung von Patienten mit unterschiedlichem genetischem Hintergrund. Die Autoren planen die Fortsetzung der Studie und eine weitere Analyse nach der Einschreibung von 100.000 Patienten über einen Zeitraum von zwei Jahren.

Hintergrund: Radiologen nutzen KI bereits seit den 1980er Jahren zur Unterstützung der Brustkrebsdiagnose (obwohl diese Methode umstritten ist). Eine Studie von Google Health aus dem Jahr 2020 behauptete, dass KI Radiologen übertrifft, aber Kritiker fanden Mängel in der Methodik.

Warum es wichtig ist: Brustkrebs verursacht weltweit jährlich mehr als 600.000 Todesfälle. Diese Arbeit legt nahe, dass KI Ärzten ermöglichen kann, mehr Fälle schneller zu bewerten und so den Mangel an Radiologen zu mildern. Darüber hinaus ist die Behandlung umso wirksamer, je früher der Krebs diagnostiziert wird, und die Methode der Autoren hat mehr frühe Fälle erkannt als späte.

Unsere Meinung: Medizinische KI-Systeme, die im Labor gut funktionieren, versagen oft in der klinischen Anwendung. Beispielsweise kann ein neuronales Netz in einer bestimmten Umgebung bei der Krebsdiagnose besser abschneiden als ein Mensch, aber es ist nicht robust gegenüber Veränderungen in der Eingabe, wenn es mit der gleichen Datenverteilung trainiert und getestet wird (z.B. Bilder aus verschiedenen Krankenhäusern oder von Patienten aus verschiedenen Bevölkerungsgruppen). Gleichzeitig wurden medizinische KI-Systeme nur sehr wenigen randomisierten kontrollierten Studien unterzogen, die als Goldstandard für medizinische Tests gelten. Solche Studien haben ihre Grenzen, sind aber ein mächtiges Instrument, um die Kluft zwischen Labor und Klinik zu überbrücken.

Schreibe einen Kommentar