MedicalLearning – Blog zur Zukunft der medizinischen Information

Sollte man medizinischen KI-Übersetzungen vertrauen?

10. Juni 2024

Maschinelle Übersetzungen bieten verlockende Vorteile, scheitern jedoch oft an fehlender Kontextsensibilität und mangelndem Fachwissen, besonders in der Medizin. Trotz eleganter Formulierungen können kritische Fehler auftreten, die menschliche Übersetzer vermeiden würden.

Die fehlende Kontextsensibilität. Die maschinelle Übersetzung (MÜ) gilt als eine „Spielart“ der künstlichen Intelligenz. Dementsprechend werden auch an die MÜ hohe Erwartungen gestellt: Verlockende Einsparpotenziale, enorme Produktivitätszuwächse und die Aussicht auf eine geschmeidige internationale Kommunikation lassen die menschliche Übersetzung zunehmend als teure und unzeitgemäße Option erscheinen. Doch als Allheilmittel gegen Zeitdruck und Budgetknappheit taugen Systeme wie DeepL, Google Translate oder Bing Translator nicht. Und das gilt in besonderem Maße für ihren Einsatz in der Medizin. Um die tatsächlichen Möglichkeiten der MÜ besser einschätzen zu können, muss man ihre Funktionsweise verstehen. Werfen wir also einen Blick unter die Haube.

Anders als eine „echte“ künstliche Intelligenz, die auf lange und komplexe Prompts durchaus beeindruckende Ergebnisse liefern und diese im Dialog mit dem Menschen sogar verfeinern und erweitern kann, ist das Blickfeld eines MÜ-Systems sehr begrenzt: Es reicht genau vom Satzanfang bis zum Satzende und nicht einen Buchstaben weiter. Auch Systeme, die ganze Word-Dokumente „in einem Rutsch“ übersetzen, liefern keine kohärente Textübersetzung, sondern Stückwerk. Dabei spielt es keine Rolle, ob das MÜ-System regelbasiert, statistisch oder neuronal arbeitet. Der fehlende Blick fürs Ganze erklärt auch, weshalb Rekursivität – vereinfacht gesagt: eine grammatische Orientierung an bereits übersetzten Textstellen – nicht in die Berechnungen der MÜ einfließen kann. Alle marktgängigen MÜ-Systeme sind also schon auf grammatischer Ebene „kontextblind“. Dadurch entstehen typische und nicht selten gefährliche MÜ-Fehler wie dieser:

Ausgangssatz: „Manche Ärzte verschreiben bei Diabetes Typ II Metformin. Sie erstellen dann einen Medikationsplan.“

Maschinelle Übersetzung: „Some doctors prescribe metformin for type II diabetes. You then draw up a medication plan.“

Da die MÜ das Textgefüge nicht kennt, wird sie solche Fehler permanent in die Übersetzung einstreuen. Diese müssen natürlich vor einer etwaigen Verwertung mit gehörigem Zeit- und Kostenaufwand beseitigt werden. Es ist einem MÜ-System nicht möglich, ein Homonym, also ein Wort mit mehreren möglichen Bedeutungen, aus dem Kontext heraus zu disambiguieren. Besonders tückisch ist das bei den allgegenwärtigen medizinischen Abkürzungen, die auch menschliche Übersetzer an ihre Grenzen bringen können. Ob also „EKG“ für „Elektrokardiogramm“ oder für „Echokardiogramm“ steht, kann das MÜ-System nicht beurteilen – in solchen Situationen wird es schlicht und ergreifend raten und den Adressaten mit der „Monkey-Quote“ von 50:50 in die Irre führen. Diesen virtuellen Münzwurf vollzieht das MÜ-System auch auf stilistischer Ebene. Richtet sich der Text an ein Fachpublikum oder an Laien? Erwartet der Leser also fachsprachliche oder gemeinsprachliche Nomenklatur? Verwende ich „Fractura basis cranii“ oder doch lieber „Schädelbasisbruch“?

Ermöglicht werden diese teils krassen Qualitätsmängel auch dadurch, dass die Quelltexte nicht immer einem ordentlichen Lektorat unterzogen werden, bevor sie an die MÜ übergeben werden. Fast zwangsläufig entstehen dann aus mangelnder Textqualität und aus einer Überschätzung der MÜ sprachliche und inhaltliche Fehler, die einem professionellen Übersetzer wohl kaum unterlaufen würden.

Das fehlende Wissen. Menschliche Übersetzer verstehen und übersetzen Texte nicht linear, sondern in einem Kontinuum aus Sprachwissen und Weltwissen. Letzteres ist für die Interpretation unscharfer Textstellen unverzichtbar. Denn auch ein grammatisch vollkommen korrekter Satz kann im Extremfall blanken Unsinn ergeben. Der berühmte Sprachwissenschaftler Noam Chomsky hat zur Veranschaulichung dieses Phänomens den folgenden Beispielsatz ersonnen:

„Colorless green ideas sleep furiously.“

Übergibt man diesen grammatisch korrekten und doch unsinnigen Satz an ein MÜ-System, liefert es devot die erbetene (und ebenso unsinnige) Übersetzung. Ein Mensch wüsste sofort, dass sich jeder Versuch, einen unsinnigen Satz zu übersetzen, von alleine verbietet. Er würde mit seinem Auftraggeber Rücksprache halten, um über eine Korrektur des womöglich irrtümlich sinnentstellten Satzes zu sprechen. Ein MÜ-System liefert diesen Mehrwert nicht. Denn ein MÜ-System weiß rein gar nichts. Diese wissensferne Übersetzungsstrategie macht die MÜ so tückisch: Sie erzeugt aus guten und sogar aus schlechten Sätzen fast immer grammatisch stimmige, oftmals sogar besonders elegante Übersetzungen. Auch wenn dabei völliger Blödsinn entsteht. Doch nicht immer machen dadaistische Formulierungen den Leser stutzig. Hier ein Beispiel für eine etwas subtilere maschinelle Fehlübersetzung, wie sie einem in der Praxis immer wieder begegnen:

Ausgangssatz: „The patient was advised to cooperate in blood glucose control to achieve levels between 4.5 and 6.7 mmol/l.“

Maschinelle Übersetzung: „Dem Patienten wurde geraten, bei der Blutzuckerkontrolle mitzuwirken, um Werte zwischen 4,5 und 6,7 mmol/l zu erreichen.“

Ein kompetenter Fachübersetzer würde den schönen Schein sofort durchschauen und erkennen, dass blood glucose control (= Blutzuckereinstellung) ein „falscher Freund“ ist, der zu einer wörtlichen und somit falschen Übersetzung verleitet. Er wüsste auch, dass Blutzuckerwerte im deutschen Sprachraum üblicherweise in mg/dl angegeben werden und nicht in mmol/l, wie in Nordamerika. Und sehr wahrscheinlich hätte er sich auch gefragt, ob sich das Wort patient wirklich auf einen Mann bezieht.

Menschliches Wissen und Intuition spielen beim klassischen Übersetzen eine tragende Rolle. Manche Übersetzungsagenturen verbieten daher ihren Übersetzern den Einsatz von MÜ bei medizinischen Texten. Und einige lassen nur medizinisch vorgebildete Übersetzer an solche Texte heran. Wieder andere stellen sich auf den Standpunkt, maschinelle Übersetzungen müssten nur noch durch irgendeinen Muttersprachler nachbearbeitet werden, um den nötigen Feinschliff zu bekommen. Diese Vorstellung ist jedoch vollkommen abwegig, denn die Muttersprache alleine qualifiziert niemanden dazu, eine medizinische Fachübersetzung zu korrigieren. Man ist auch kein Klaviervirtuose, nur weil man zwei Hände hat. Für die Qualitätssicherung an einer MÜ bieten sich zwei Strategien an: (1) eine die Fehler offenbarende Rückübersetzung (back-translation, BT) des MÜ-Resultats durch ein MÜ-System oder (2) eine Qualitätsabschätzung (quality estimation, QE) durch eine medizinische Fachkraft. In einer vielbeachteten Studie aus dem Jahr 2023 kam ein amerikanisches Forscherteam zu dem Ergebnis, dass beim MÜ-Einsatz in der Medizin eine Kombination aus MÜ, BT und QE am ehesten zu einer vernünftigen Übersetzungsqualität führen könnte. Das klingt nicht gerade nach einem kostengünstigen Prozedere.

Autor: Armin Mutscheller (E-Mail: info@mutscheller.de)

Über den Autor: Studium an der Universität Heidelberg, Diplom-Übersetzer für Englisch und Französisch, parallel Ausbildung zum Rettungssanitäter mit 10-jähriger Tätigkeit in diesem Beruf. Spezialisiert auf medizinische und technische Fachübersetzungen, Terminologie-Management und Textredaktion, Beratung von zahlreichen Unternehmen in sprachlichen Fragen. Am Heidelberger Institut für Übersetzen und Dolmetschen unterrichtet er Studierende in gemeinsprachlichem und technischem Übersetzen und hält Vorträge zu berufspraktischen Themen.

Bild: leonardo.ai für arztCME

← Femtech-Apps verbessern die Frauengesundheit KI-Übersetzungen: Die Haftungsfrage →

Weitere Beiträge …

CME in den USA – Regulierung, Inhalte, Pflichten

14. Juli 2025

Wie organisiert man medizinische Fortbildung auf nationaler Ebene? Ein Vergleich zwischen Deutschland und den USA zeigt zwei sehr unterschiedliche Systeme...

zum Beitrag

Centaur: Wie vorhersagbar ist menschliches Denken?

5. Juli 2025

Ein Nature-Paper aus der letzten Woche beschreibt ein KI-System, das menschliches Verhalten vorhersagen kann. Ein Meilenstein für die Neurowissenschaften und...

zum Beitrag

Neue Hoffnung: KI erkennt über 170 Tumorarten

29. Juni 2025

Ein Forschungsteam der Charité Berlin hat ein KI-Modell entwickelt, das auf Basis epigenetischer Daten selbst seltene Tumorarten präzise diagnostiziert –...

zum Beitrag

ePA mal anders: Digital Twin in der Medizin

23. Juni 2025

Vom 19.-21. Juni 2025 fand in Köln der Jahreskongress der GSAAM statt – der deutschen Gesellschaft für Prävention und Anti...

zum Beitrag

Medical Writing: KI als Jobkiller?

15. Juni 2025

Zwischen Präzision, Verantwortung und Maschinenintelligenz steht ein Berufsbild vor dem Umbruch. Was bleibt vom klassischen „Medical Writer“, wenn Künstliche Intelligenz...

zum Beitrag

KI in der Medizin: Das sagt der Ärztetag

2. Juni 2025

Lernende Systeme werden schon in wenigen Jahren Teil des medizinischen Alltags sein, indem sie Verwaltungsabläufe in Klinik und Praxis effizienter...

zum Beitrag

Internetnutzungsstörungen

26. Mai 2025

Die S1-Leitlinie gibt erstmals strukturierte Empfehlungen zur Diagnostik und Therapie von Internetnutzungsstörungen – jenseits von Gaming- und Glücksspielsucht Die digitale...

zum Beitrag

DiGA – endlich in der Versorgung angekommen?

19. Mai 2025

Auf dem Internistenkongress wurde eine DiGA für Brustkrebspatient innen ausgezeichnet. Für uns ein Anlass mal zu recherchieren, wie Apps auf...

zum Beitrag

Patient Empowerment

12. Mai 2025

Der informierte Patient gilt als Zielbild moderner Versorgung. Doch zwischen Wunsch und Wirklichkeit liegt ein komplexer Praxisalltag. Empowerment ist eine...

zum Beitrag

Auch bei der ePA: Täglich grüßt das Murmeltier

5. Mai 2025

Am 29. April 2025 startete die ePA für alle. Bis alle sie auch nutzen können, wird es aber wohl noch...

zum Beitrag

Zum Blog-Archiv

MedicalLearning – Blog zur Zukunft der medizinischen Information

Sollte man medizinischen KI-Übersetzungen vertrauen?

Weitere Beiträge …

CME in den USA – Regulierung, Inhalte, Pflichten

Centaur: Wie vorhersagbar ist menschliches Denken?

Neue Hoffnung: KI erkennt über 170 Tumorarten

ePA mal anders: Digital Twin in der Medizin

Medical Writing: KI als Jobkiller?

KI in der Medizin: Das sagt der Ärztetag

Internetnutzungsstörungen

DiGA – endlich in der Versorgung angekommen?

Patient Empowerment

Auch bei der ePA: Täglich grüßt das Murmeltier

Bitte melden Sie sich an

Noch nicht registriert?