HyperAIHyperAI

Command Palette

Search for a command to run...

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

Große Sprachmodelle (LLMs), insbesondere explizite Long-CoT-Reasoning-Modelle wie DeepSeek-R1 und QWQ, haben beeindruckende Schlussfolgerungsfähigkeiten demonstriert und erzielten hervorragende Ergebnisse bei der Alltagslogik und mathematischen Inferenz. Trotz ihrer Wirksamkeit werden Long-CoT-Reasoning-Modelle häufig kritisiert, weil sie in wissensintensiven Domänen – wie der Molekülentdeckung – eine begrenzte Leistungsfähigkeit und geringe Effizienz aufweisen. Der Erfolg in diesem Bereich erfordert eine präzise Kenntnis fachspezifischen Wissens, einschließlich molekularer Strukturen und chemischer Prinzipien, was aufgrund der inhärenten Komplexität molekularer Daten und der Seltenheit hochwertiger Expertenannotationen besonders herausfordernd ist. Um diese Lücke zu schließen, stellen wir Mol-R1 vor, einen neuartigen Ansatz, der die Erklärbarkeit und die Reasoning-Leistung von R1-ähnlichen expliziten Long-CoT-Reasoning-LLMs bei der textbasierten Molekülgenerierung verbessern soll. Unser Ansatz beginnt mit einem hochwertigen Reasoning-Datensatz, der durch Prior Regulation via In-context Distillation (PRID) erstellt wurde – einer speziell entwickelten Distillation-Strategie, die effektiv Paare von Reasoning-Verläufen unter Berücksichtigung vorheriger Regeln generiert. Auf dieser Grundlage führen wir MoIA (Molecular Iterative Adaptation) ein, eine anspruchsvolle Trainingsstrategie, die iterativ Supervised Fine-tuning (SFT) mit reinforced Policy Optimization (RPO) kombiniert und gezielt darauf abzielt, die Reasoning-Leistung von R1-ähnlichen Modellen für die Molekülentdeckung zu steigern. Schließlich evaluieren wir die Leistung von Mol-R1 im Task der textbasierten Molekül-Reasoning-Generierung und zeigen, dass das Modell gegenüber bestehenden Baselines überlegen ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp