Diagnosesysteme mit künstlicher Intelligenz sind beim Erkennen verbreiteter und eindeutiger Hauterkrankungen bereits oft treffsicher. Tritt eine Hauterkrankung jedoch seltener auf oder in ungewöhnlichen Konstellationen, ist die KI der menschlichen Schwarmintelligenz deutlich unterlegen.

Die dermatologische Diagnostik basiert auf einer systematischen und sorgfältigen Untersuchung der gesamten Haut. Die verschiedensten optischen Techniken werden seit Langem und erfolgreich eingesetzt, um Hautveränderungen zu deuten. Immer mehr rückt dabei auch das Thema KI in den Fokus. Professor Dr. Michael Hertl, Präsident der DDG und Direktor der Klinik für Dermatologie und Allergologie in Marburg, erklärt das so: „Noch stärker als bei anderen Fächern bietet sich in der Dermatologie die Nutzung digitaler Techniken und der Telemedizin insgesamt an, denn auf der Haut sind viele Veränderungen gut sichtbar.“ KI sei für die Diagnostik dermatologischer Erkrankungen daher auch ein Gewinn, ihre Treffsicherheit allerdings davon abhängig, wie und mit welchen Informationen sie „trainiert“ wird.

KI vs. humane Expertise: Wer gewinnt?

Im Zentrum der maschinellen Verarbeitung von medizinischen Bilddaten stehen die sogenannten „faltenden neuronalen Netzwerke“ (CNN), deren hochkomplexes Können antrainiert ist. Sie können mit hoher Treffsicherheit bei klarer Fragestellung z. B. zwischen gutartig und bösartig unterscheiden und häufige sowie eindeutige Hauterkrankungen klassifizieren. „Die hohe diagnostische Präzision, die mithilfe von CNN erreicht werden kann, führte bereits zu der aus unserer Sicht abwegigen Schlussfolgerung, die ärztliche diagnostische Expertise sei in Zukunft entbehrlich“, betont Professor Dr. med. Julia Welzel, Direktorin der Klinik für Dermatologie und Allergologie in Augsburg sowie DDG-Generalsekretärin. Eine aktuelle Studie zeigt nun auf, dass menschliche Intelligenz in „gebündelter“ Form nicht nur die diagnostische Korrektheit von einzelnen Personen übertrifft, sondern auch die von KI-Systemen.

Was steckt dahinter? Eine Forschergruppe um den Heidelberger Dermatologen Professor Dr. med. Hänßle verglich die Leistung dreier diagnostischer Gruppen: kollektive menschliche Intelligenz (CoHI = collective human intelligence), die Expertise einzelner Dermatologen sowie zwei CNN. 120 Dermatologen wurden in einem anspruchsvollen Quiz 30 klinische/dermatoskopische Fälle (Hautläsionen) mit kurzen anamnestischen Angaben gezeigt, die sie klassifizierten und diagnostizierten. Unter diesen Fällen waren viele seltene, schwer zu diagnostizierende Erkrankungen. Abgestimmt wurde mittels Televoting, bei dem nicht nur die richtige Antwort zählte, sondern auch die Geschwindigkeit. Im Nachgang präsentierte man dieselben Fälle einer KI. Zusätzlich berechneten die Forscher ein Mehrheitsvotum, das sie Schwarmintelligenz nannten. Die humane Schwarmintelligenz war der KI im anspruchsvollen, aber realitätsnahen Wettbewerb deutlich überlegen. Bisher hatten Studien primär die Leistungsfähigkeit von CNN im Vergleich zu einzelnen Ärzten verglichen. Die Querschnittsstudie zeigt nun, dass die Korrektheit kollektiver humaner ­Intelligenz die von Deep-Learning-Technologien und Einzelpersonen übertrifft, so Hertl. KI könne z. B. bei eindeutigen und häufigen Hauterkrankungen unterstützen und die Versorgung insgesamt ­verbessern, z. B. bei geringer Hautarztdichte vor Ort.


Quelle
Deutsche Dermatologische Gesellschaft (DDG)


Autorin:
Sabine Mack

Erschienen in: DERMAforum, 2021; 25 (12) Seite 15