Zertifizierte CME-Fortbildung für Ärztinnen und Ärzte. CME-Punkte sammeln. Kostenfrei. service@arztcme.de

MedicalLearning – Blog zur Zukunft der medizinischen Information

Sollte man medizinischen KI-Übersetzungen vertrauen?

10. Juni 2024

Maschinelle Übersetzungen bieten verlockende Vorteile, scheitern jedoch oft an fehlender Kontextsensibilität und mangelndem Fachwissen, besonders in der Medizin. Trotz eleganter Formulierungen können kritische Fehler auftreten, die menschliche Übersetzer vermeiden würden.

Die fehlende Kontextsensibilität. Die maschinelle Übersetzung (MÜ) gilt als eine „Spielart“ der künstlichen Intelligenz. Dementsprechend werden auch an die MÜ hohe Erwartungen gestellt: Verlockende Einsparpotenziale, enorme Produktivitätszuwächse und die Aussicht auf eine geschmeidige internationale Kommunikation lassen die menschliche Übersetzung zunehmend als teure und unzeitgemäße Option erscheinen. Doch als Allheilmittel gegen Zeitdruck und Budgetknappheit taugen Systeme wie DeepL, Google Translate oder Bing Translator nicht. Und das gilt in besonderem Maße für ihren Einsatz in der Medizin. Um die tatsächlichen Möglichkeiten der MÜ besser einschätzen zu können, muss man ihre Funktionsweise verstehen. Werfen wir also einen Blick unter die Haube.

Anders als eine „echte“ künstliche Intelligenz, die auf lange und komplexe Prompts durchaus beeindruckende Ergebnisse liefern und diese im Dialog mit dem Menschen sogar verfeinern und erweitern kann, ist das Blickfeld eines MÜ-Systems sehr begrenzt: Es reicht genau vom Satzanfang bis zum Satzende und nicht einen Buchstaben weiter. Auch Systeme, die ganze Word-Dokumente „in einem Rutsch“ übersetzen, liefern keine kohärente Textübersetzung, sondern Stückwerk. Dabei spielt es keine Rolle, ob das MÜ-System regelbasiert, statistisch oder neuronal arbeitet. Der fehlende Blick fürs Ganze erklärt auch, weshalb Rekursivität – vereinfacht gesagt: eine grammatische Orientierung an bereits übersetzten Textstellen – nicht in die Berechnungen der MÜ einfließen kann. Alle marktgängigen MÜ-Systeme sind also schon auf grammatischer Ebene „kontextblind“. Dadurch entstehen typische und nicht selten gefährliche MÜ-Fehler wie dieser:

Ausgangssatz: „Manche Ärzte verschreiben bei Diabetes Typ II Metformin. Sie erstellen dann einen Medikationsplan.“

Maschinelle Übersetzung: „Some doctors prescribe metformin for type II diabetes. You then draw up a medication plan.“

Da die MÜ das Textgefüge nicht kennt, wird sie solche Fehler permanent in die Übersetzung einstreuen. Diese müssen natürlich vor einer etwaigen Verwertung mit gehörigem Zeit- und Kostenaufwand beseitigt werden. Es ist einem MÜ-System nicht möglich, ein Homonym, also ein Wort mit mehreren möglichen Bedeutungen, aus dem Kontext heraus zu disambiguieren. Besonders tückisch ist das bei den allgegenwärtigen medizinischen Abkürzungen, die auch menschliche Übersetzer an ihre Grenzen bringen können. Ob also „EKG“ für „Elektrokardiogramm“ oder für „Echokardiogramm“ steht, kann das MÜ-System nicht beurteilen – in solchen Situationen wird es schlicht und ergreifend raten und den Adressaten mit der „Monkey-Quote“ von 50:50 in die Irre führen. Diesen virtuellen Münzwurf vollzieht das MÜ-System auch auf stilistischer Ebene. Richtet sich der Text an ein Fachpublikum oder an Laien? Erwartet der Leser also fachsprachliche oder gemeinsprachliche Nomenklatur? Verwende ich „Fractura basis cranii“ oder doch lieber „Schädelbasisbruch“?

Ermöglicht werden diese teils krassen Qualitätsmängel auch dadurch, dass die Quelltexte nicht immer einem ordentlichen Lektorat unterzogen werden, bevor sie an die MÜ übergeben werden. Fast zwangsläufig entstehen dann aus mangelnder Textqualität und aus einer Überschätzung der MÜ sprachliche und inhaltliche Fehler, die einem professionellen Übersetzer wohl kaum unterlaufen würden.

Das fehlende Wissen. Menschliche Übersetzer verstehen und übersetzen Texte nicht linear, sondern in einem Kontinuum aus Sprachwissen und Weltwissen. Letzteres ist für die Interpretation unscharfer Textstellen unverzichtbar. Denn auch ein grammatisch vollkommen korrekter Satz kann im Extremfall blanken Unsinn ergeben. Der berühmte Sprachwissenschaftler Noam Chomsky hat zur Veranschaulichung dieses Phänomens den folgenden Beispielsatz ersonnen:

„Colorless green ideas sleep furiously.“

Übergibt man diesen grammatisch korrekten und doch unsinnigen Satz an ein MÜ-System, liefert es devot die erbetene (und ebenso unsinnige) Übersetzung. Ein Mensch wüsste sofort, dass sich jeder Versuch, einen unsinnigen Satz zu übersetzen, von alleine verbietet. Er würde mit seinem Auftraggeber Rücksprache halten, um über eine Korrektur des womöglich irrtümlich sinnentstellten Satzes zu sprechen. Ein MÜ-System liefert diesen Mehrwert nicht. Denn ein MÜ-System weiß rein gar nichts. Diese wissensferne Übersetzungsstrategie macht die MÜ so tückisch: Sie erzeugt aus guten und sogar aus schlechten Sätzen fast immer grammatisch stimmige, oftmals sogar besonders elegante Übersetzungen. Auch wenn dabei völliger Blödsinn entsteht. Doch nicht immer machen dadaistische Formulierungen den Leser stutzig. Hier ein Beispiel für eine etwas subtilere maschinelle Fehlübersetzung, wie sie einem in der Praxis immer wieder begegnen:

Ausgangssatz: „The patient was advised to cooperate in blood glucose control to achieve levels between 4.5 and 6.7 mmol/l.“

Maschinelle Übersetzung: „Dem Patienten wurde geraten, bei der Blutzuckerkontrolle mitzuwirken, um Werte zwischen 4,5 und 6,7 mmol/l zu erreichen.“

Ein kompetenter Fachübersetzer würde den schönen Schein sofort durchschauen und erkennen, dass blood glucose control (= Blutzuckereinstellung) ein „falscher Freund“ ist, der zu einer wörtlichen und somit falschen Übersetzung verleitet. Er wüsste auch, dass Blutzuckerwerte im deutschen Sprachraum üblicherweise in mg/dl angegeben werden und nicht in mmol/l, wie in Nordamerika. Und sehr wahrscheinlich hätte er sich auch gefragt, ob sich das Wort patient wirklich auf einen Mann bezieht.

Menschliches Wissen und Intuition spielen beim klassischen Übersetzen eine tragende Rolle. Manche Übersetzungsagenturen verbieten daher ihren Übersetzern den Einsatz von MÜ bei medizinischen Texten. Und einige lassen nur medizinisch vorgebildete Übersetzer an solche Texte heran. Wieder andere stellen sich auf den Standpunkt, maschinelle Übersetzungen müssten nur noch durch irgendeinen Muttersprachler nachbearbeitet werden, um den nötigen Feinschliff zu bekommen. Diese Vorstellung ist jedoch vollkommen abwegig, denn die Muttersprache alleine qualifiziert niemanden dazu, eine medizinische Fachübersetzung zu korrigieren. Man ist auch kein Klaviervirtuose, nur weil man zwei Hände hat. Für die Qualitätssicherung an einer MÜ bieten sich zwei Strategien an: (1) eine die Fehler offenbarende Rückübersetzung (back-translation, BT) des MÜ-Resultats durch ein MÜ-System oder (2) eine Qualitätsabschätzung (quality estimation, QE) durch eine medizinische Fachkraft. In einer vielbeachteten Studie aus dem Jahr 2023 kam ein amerikanisches Forscherteam zu dem Ergebnis, dass beim MÜ-Einsatz in der Medizin eine Kombination aus MÜ, BT und QE am ehesten zu einer vernünftigen Übersetzungsqualität führen könnte. Das klingt nicht gerade nach einem kostengünstigen Prozedere.

Autor: Armin Mutscheller (E-Mail: info@mutscheller.de)

Über den Autor: Studium an der Universität Heidelberg, Diplom-Übersetzer für Englisch und Französisch, parallel Ausbildung zum Rettungssanitäter mit 10-jähriger Tätigkeit in diesem Beruf. Spezialisiert auf medizinische und technische Fachübersetzungen, Terminologie-Management und Textredaktion, Beratung von zahlreichen Unternehmen in sprachlichen Fragen. Am Heidelberger Institut für Übersetzen und Dolmetschen unterrichtet er Studierende in gemeinsprachlichem und technischem Übersetzen und hält Vorträge zu berufspraktischen Themen.

Bild: leonardo.ai für arztCME

Weitere Beiträge …