LLMs brillieren in Benchmarks – doch als „First Point of Contact“ für Laien zeigt sich eine kritische Schwachstelle. Die medizinische Fachwelt blickt mit einer Mischung aus Skepsis und Faszination auf die rasanten Fortschritte bei Large Language Models (LLMs). Während aktuelle Modelle wie GPT-4o oder Llama 3 in medizinischen Staatsexamen nahezu perfekte Ergebnisse erzielen, stellt sich die entscheidende Frage nach ihrer Sicherheit im klinischen Alltag – insbesondere als „First Point of Contact“ für medizinische Laien. Eine aktuelle, im Fachjournal Nature Medicine veröffentlichte Studie...










