Implementierungsdetails
KI-Pipeline-Architektur
Pfizers Umsetzung konzentrierte sich auf eine skalierbare ML-Plattform, die Deep Learning für Strukturvorhersage und generative gegnerische Netzwerke (GANs) für das Design neuartiger Moleküle kombinierte. Mit Modellen im Stil von AlphaFold und proprietären graphneuronalen Netzwerken (GNNs) modellierten sie die Dynamik des aktiven Zentrums von Mpro mit atomarer Präzision. Dies ermöglichte Docking-Simulationen, die bis zu 100x schneller waren als klassische Methoden.[1]
Wesentliche Komponenten umfassten:
- Proteinstruktur-Analyse: ML verfeinerte niedrigauflösende Kryo-EM-Karten zu hochqualitativen Modellen und identifizierte verborgene Taschen für Inhibitorbindung.
- Virtuelles Screening: Ensemble-ML-Klassifikatoren bewerteten über 100 Millionen Verbindungen aus Pfizers Bibliothek und öffentlichen Datenbanken in unter 48 Stunden.
- Generatives Design: Reinforcement Learning optimierte Leads wie Vorstufen von Nirmatrelvir und steigerte die Potenz um das 100‑fache.
Technologie-Stack und Integration
Der Stack nutzte High-Performance-Computing (HPC)-Cluster mit NVIDIA-GPUs und Frameworks wie PyTorch und RDKit. Pfizers AI Sandbox ermöglichte schnelles Prototyping und wurde mit Schrödingers physikbasierten Tools für hybride Validierung integriert. Datenpipelines verwendeten föderiertes Lernen, um externe COVID-Datensätze sicher einzubinden.[3] Maßgeschneiderte ML-Modelle wurden auf Terabytes struktureller Daten trainiert und erreichten eine 90%ige Genauigkeit bei der Vorhersage von Bindungsaffinitäten gegenüber experimentellen Werten.
Entwicklungszeitplan
Januar 2020: Beginn der Pandemie löst Mpro-Strukturermittlung per Röntgen aus.[2]
März 2020: ML-gestützte virtuelle Screens identifizieren erste Hits.
April–Mai 2020: Iterative, ML-geführte Synthesen führen zum Nirmatrelvir-Kandidaten.
Juni 2020: Präklinische Einsatzbereitschaft in insgesamt 4 Monaten.
EPIC-HALO-Studie startet November 2020, EUA Dezember 2021.
Herausforderungen wie Datenknappheit wurden durch Transfer Learning von Flavivirus-Proteasen und aktive Lernschleifen, die Synthesen adaptiv abfragten, überwunden.
Team und Zusammenarbeit
Bereichsübergreifende Teams aus über 50 Computational Chemists, ML-Ingenieuren und Biologen arbeiteten in agilen Sprints zusammen. Partnerschaften mit BioNTech (Vakzine) informierten antivirale Strategien, während Open-Source-Beiträge die Modell-Benchmarking beschleunigten.[5]
Diese durchgängige KI-Integration erfüllte nicht nur die Dringlichkeit der Pandemie, sondern lieferte auch eine Blaupause für zukünftige Ausbrüche.