HyperAIHyperAI
vor 10 Tagen

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung

Jiatong Li, Weida Wang, Qinggang Zhang, Junxian Li, Di Zhang, Changmeng Zheng, Shufei Zhang, Xiaoyong Wei, Qing Li
Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung
Abstract

Große Sprachmodelle (LLMs), insbesondere explizite Long-CoT-Reasoning-Modelle wie DeepSeek-R1 und QWQ, haben beeindruckende Schlussfolgerungsfähigkeiten demonstriert und erzielten hervorragende Ergebnisse bei der Alltagslogik und mathematischen Inferenz. Trotz ihrer Wirksamkeit werden Long-CoT-Reasoning-Modelle häufig kritisiert, weil sie in wissensintensiven Domänen – wie der Molekülentdeckung – eine begrenzte Leistungsfähigkeit und geringe Effizienz aufweisen. Der Erfolg in diesem Bereich erfordert eine präzise Kenntnis fachspezifischen Wissens, einschließlich molekularer Strukturen und chemischer Prinzipien, was aufgrund der inhärenten Komplexität molekularer Daten und der Seltenheit hochwertiger Expertenannotationen besonders herausfordernd ist. Um diese Lücke zu schließen, stellen wir Mol-R1 vor, einen neuartigen Ansatz, der die Erklärbarkeit und die Reasoning-Leistung von R1-ähnlichen expliziten Long-CoT-Reasoning-LLMs bei der textbasierten Molekülgenerierung verbessern soll. Unser Ansatz beginnt mit einem hochwertigen Reasoning-Datensatz, der durch Prior Regulation via In-context Distillation (PRID) erstellt wurde – einer speziell entwickelten Distillation-Strategie, die effektiv Paare von Reasoning-Verläufen unter Berücksichtigung vorheriger Regeln generiert. Auf dieser Grundlage führen wir MoIA (Molecular Iterative Adaptation) ein, eine anspruchsvolle Trainingsstrategie, die iterativ Supervised Fine-tuning (SFT) mit reinforced Policy Optimization (RPO) kombiniert und gezielt darauf abzielt, die Reasoning-Leistung von R1-ähnlichen Modellen für die Molekülentdeckung zu steigern. Schließlich evaluieren wir die Leistung von Mol-R1 im Task der textbasierten Molekül-Reasoning-Generierung und zeigen, dass das Modell gegenüber bestehenden Baselines überlegen ist.

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung | Neueste Forschungsarbeiten | HyperAI