Eckdaten

  • Company: NYU Langone Health
  • Unternehmensgröße: über 53.000 Mitarbeitende, über 12 Mrd. $ Jahresumsatz
  • Standort: New York, NY
  • Eingesetztes KI‑Tool: NYUTron (kundenspezifisches klinisches LLM mit 6,7 Milliarden Parametern)
  • Erzieltes Ergebnis: 0.932 AUROC für stationäre Mortalität, 4–5 Punkte besser als Baselines

Möchten Sie ähnliche Ergebnisse mit KI erzielen?

Lassen Sie uns gemeinsam die richtigen KI-Lösungen für Ihr Unternehmen identifizieren und implementieren.

Die Herausforderung

At NYU Langone Health, one of the largest U.S. academic medical centers, 80% of electronic health record (EHR) data exists as unstructured free-text clinical notes, rich in nuanced patient insights but notoriously difficult to process for predictive analytics [1][2]. Traditional machine learning models depend on structured data like vital signs and labs, missing subtle signals in physician narratives that could forecast critical outcomes such as in-hospital mortality, prolonged length of stay (LOS), readmissions, and even operational issues like appointment no-shows [1][3]. This gap leads to less accurate risk stratification, inefficient resource use, and delayed interventions in a system handling millions of encounters yearly [4].

Developing task-specific models exacerbates challenges: each requires laborious feature engineering, labeled data curation, and maintenance, straining resources in a dynamic clinical environment. With rising patient volumes and complexity, NYU Langone needed a scalable, versatile prediction engine capable of leveraging raw notes without preprocessing hurdles [2][5].

Die Lösung

NYU Langone's Division of Applied AI Technologies at the Center for Healthcare Innovation and Delivery Science created NYUTron, a foundational 6.7-billion-parameter large language model (LLM) pretrained on 10+ years of de-identified inpatient clinical notes—4 billion words from 4.4 million encounters [1][4]. Using a GPT-like architecture, NYUTron learns medical language intricacies, enabling it to serve as an 'all-purpose clinical prediction engine' [1].

The model is fine-tuned on modest labeled datasets for 10 diverse tasks, from clinical predictions (e.g., mortality, LOS) to operational forecasts (e.g., no-shows), bypassing complex pipelines of prior models [2][3]. This approach yields superior performance over baselines like ClinicalBERT and structured models, with easy deployment into workflows [1][5]. Ongoing expansions include generative applications and education tools [6].

Quantitative Ergebnisse

  • AUROC für stationäre Mortalität: <strong>0.932</strong> (vs. strukturiertes Baseline-Modell <strong>0.886</strong>)
  • AUROC für verlängerte Verweildauer (LOS): <strong>0.906</strong> (vs. <strong>0.870</strong>)
  • AUROC für 30‑Tage‑Wiederaufnahmen: <strong>0.773</strong> (vs. <strong>0.727</strong>)
  • AUROC für 48‑Stunden‑Mortalität: <strong>0.969</strong>
  • AUROC für Vorhersage von Hochkostenaufenthalten: <strong>0.842</strong> (vs. <strong>0.808</strong>)
  • Durchschnittlicher AUROC‑Zuwachs gegenüber Top‑Baselines: <strong>4.4 Punkte</strong>
  • Korpusgröße: <strong>4 Mrd. Wörter</strong> aus <strong>10 Jahren</strong> von <strong>4.4 Mio. Begegnungen</strong>

Bereit, Ihr Unternehmen mit KI zu transformieren?

Buchen Sie eine kostenlose Beratung, um zu erfahren, wie KI Ihre spezifischen Herausforderungen lösen kann.

Implementierungsdetails

Entwicklung des NYUTron‑Foundation‑Modells

Der Eckpfeiler von NYU Langones KI‑Strategie ist NYUTron, ein LLM mit 6,7 Milliarden Parametern, entwickelt von der Division of Applied AI Technologies. Das Pretraining erfolgte auf einem massiven Korpus von 10 Jahren de‑identifizierter stationärer klinischer Notizen von NYU Langone Health mit insgesamt 4,0 Milliarden Wörtern über 4,4 Millionen Patientenkontakte, das vielfältige Narrative von Ärzten, Pflegekräften und Fachärzten abbildet.[1] Dieses Dataset fängt real‑world medizinische Diskurse ein, einschließlich Abkürzungen, Jargon und kontextueller Nuancen, die in öffentlichen Benchmarks oft fehlen. Unter Nutzung einer decoder‑only GPT‑Architektur wurde NYUTron darauf trainiert, das nächste Token in Sequenzen vorherzusagen, wodurch ein tiefes Verständnis klinischer Semantik entstand, zunächst ohne task‑spezifische Supervision.[4]

Feinabstimmungs‑Pipeline für Multitask‑Vorhersagen

Nach dem Pretraining wurde NYUTron separat für 10 Vorhersageaufgaben feinabgestimmt, wobei kleine, beschriftete Teilmengen (z. B. Tausende Beispiele pro Aufgabe) aus EHR‑Labels verwendet wurden. Die Aufgaben reichten von klinischen Outcomes wie stationärer Mortalität, 48‑Stunden‑Mortalität, verlängerter Verweildauer (>7 Tage), 30‑Tage‑Wiederaufnahmen und Hochkostenaufenthalten bis zu operativen Kennzahlen wie zukünftige No‑Show‑Wahrscheinlichkeit und Versicherungsablehnungswahrscheinlichkeit.[1] Das Fine‑Tuning nutzte binäre Klassifikationsköpfe auf den LLM‑Embedding‑Vektoren, optimiert mit Kreuzentropie‑Loss. Dadurch erzielte man AUROC‑Werte, die im Schnitt 4,4 Punkte höher lagen als Baselines wie PLM‑ICU, MedBERT und strukturierte logistische Regressionen auf getrennten Testsets von 2021–2022.[2] Validierung erfolgte über zeitliche Splits, um Generalisierbarkeit sicherzustellen und Overfitting zu verringern.

Überwindung zentraler Herausforderungen

Wesentliche Hürden waren der Umgang mit rauschhaften, heterogenen Notizen und die Gewährleistung von Datenschutz/Compliance nach HIPAA. NYUTron adressierte Rauschen durch massive Datenmengen und selbstüberwachtes Lernen; De‑Identifizierungs‑Pipelines entfernten PHI konsequent.[3] Rechenintensive Anforderungen wurden mit GPU‑Clustern bewältigt, wodurch das Training in Wochen möglich wurde. Im Gegensatz zu strukturierten Modellen, die auf Feature‑Pipelines angewiesen sind, reduzierte NYUTrons End‑to‑End‑Notizintegration die Vorverarbeitung intern um schätzungsweise 90%.[5] Bias‑Minderung nutzte die demografische Vielfalt der NYU‑Patientenbasis; fortlaufende Fairness‑Audits sind jedoch Teil der Roadmap.

Bereitstellung und Integration

NYUTron wird produktiv über APIs in das EHR‑Ökosystem von NYU Langone (Epic) integriert und markiert Hochrisiko‑Patienten in Echtzeit während der Notizerfassung. Pilotprojekte auf Intensivstationen und Normalstationen zeigen die Praxistauglichkeit; Modelle werden quartalsweise mit frischen Daten aktualisiert.[4] Die modulare Architektur erlaubt das Hinzufügen neuer Aufgaben innerhalb von Stunden. Jüngste Erweiterungen (2025) integrieren agentic RAG und offene LLM‑Gewichte für die Ausbildung von Assistenzärzten, wobei NYUTron für Fall‑Insights abgefragt wird.[6] Die Roadmap sieht außerdem multimodale Eingaben (z. B. Bildbefunde) und generative Zusammenfassungen vor.

Zeitrahmen und Skalierbarkeit

Initiiert 2021 in Folge der COVID‑Belastungen, wurde der Kern von NYUTron im Jahr 2023 mit der wegweisenden Nature‑Publikation vorgestellt.[1] Bis 2025 ist es systemweit skaliert und treibt gesundheitssystemweite Vorhersagen über mehr als 370 Standorte an. Dieser Ansatz — einmal trainieren, überall feinabstimmen — macht NYUTron zum Blueprint für KI im Gesundheitswesen.

Interesse an KI für Ihre Branche?

Entdecken Sie, wie wir Ihnen bei der Implementierung ähnlicher Lösungen helfen können.

Ergebnisse

Die Einführung von NYUTron hat die prädiktive Analytik bei NYU Langone Health grundlegend verändert und State‑of‑the‑Art‑Genauigkeit über Benchmarks geliefert. Für die stationäre Mortalität erzielte es beeindruckende AUROC‑Werte von 0.932 und übertraf damit strukturierte Baselines (0.886) sowie Modelle wie ClinicalBERT (0.921); analog erreichte die Vorhersage einer verlängerten Verweildauer 0.906 gegenüber 0.870.[1] Bei 30‑Tage‑Wiederaufnahmen lag die AUROC bei 0.773, und Nischenaufgaben wie die 48‑Stunden‑Mortalität erreichten 0.969. Operative Vorhersagen, etwa die No‑Show‑Wahrscheinlichkeit (0.882), ermöglichen proaktives Terminmanagement und können Verluste in einem System mit Millionen von Besuchen reduzieren.[2] Diese Verbesserungen führen zu greifbaren Effekten: Kliniker erhalten aus Roh‑Notizen verwertbare Insights, die frühe Interventionen und bessere Ressourcenplanung unterstützen. Der durchschnittliche AUROC‑Vorteil von 4.4 Punkten gegenüber Wettbewerbern deutet auf relative Verbesserungen der Risikovorhersage von 5–10% hin, was sich in Pilotprojekten mit besseren Patientenergebnissen korreliert.[3] Kostenseitig spart das Umgehen aufwändiger Feature‑Engineering‑Prozesse jährlich Tausende von Ingenieursstunden. Seit 2025 sagt NYUTron Ereignisse »at scale« im gesamten Gesundheitssystem voraus und erweitert die Nutzung auf die Ausbildung durch KI‑Advisors, die die Assistenzärzte‑Schulung verbessern.[6] Langfristig demonstriert NYUTron den Wert von Foundation‑Modellen im Gesundheitswesen und belegt das Potenzial unstrukturierter Daten. Fortlaufende Verfeinerungen adressieren Concept Drift und stärken die Robustheit, wodurch NYU Langone als KI‑Vorreiter in einem sich wandelnden regulatorischen Umfeld positioniert bleibt.[5]

Kontaktieren Sie uns!

0/10 min.

Direkt Kontaktieren

Your Contact

Philipp M. W. Hoffmann

Founder & Partner

Adresse

Reruption GmbH

Falkertstraße 2

70176 Stuttgart

Kontakt

Social Media