vor 6 Monaten

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

Große Sprachmodelle (LLMs), insbesondere explizite Long-CoT-Reasoning-Modelle wie DeepSeek-R1 und QWQ, haben beeindruckende Schlussfolgerungsfähigkeiten demonstriert und erzielten hervorragende Ergebnisse bei der Alltagslogik und mathematischen Inferenz. Trotz ihrer Wirksamkeit werden Long-CoT-Reasoning-Modelle häufig kritisiert, weil sie in wissensintensiven Domänen – wie der Molekülentdeckung – eine begrenzte Leistungsfähigkeit und geringe Effizienz aufweisen. Der Erfolg in diesem Bereich erfordert eine präzise Kenntnis fachspezifischen Wissens, einschließlich molekularer Strukturen und chemischer Prinzipien, was aufgrund der inhärenten Komplexität molekularer Daten und der Seltenheit hochwertiger Expertenannotationen besonders herausfordernd ist. Um diese Lücke zu schließen, stellen wir Mol-R1 vor, einen neuartigen Ansatz, der die Erklärbarkeit und die Reasoning-Leistung von R1-ähnlichen expliziten Long-CoT-Reasoning-LLMs bei der textbasierten Molekülgenerierung verbessern soll. Unser Ansatz beginnt mit einem hochwertigen Reasoning-Datensatz, der durch Prior Regulation via In-context Distillation (PRID) erstellt wurde – einer speziell entwickelten Distillation-Strategie, die effektiv Paare von Reasoning-Verläufen unter Berücksichtigung vorheriger Regeln generiert. Auf dieser Grundlage führen wir MoIA (Molecular Iterative Adaptation) ein, eine anspruchsvolle Trainingsstrategie, die iterativ Supervised Fine-tuning (SFT) mit reinforced Policy Optimization (RPO) kombiniert und gezielt darauf abzielt, die Reasoning-Leistung von R1-ähnlichen Modellen für die Molekülentdeckung zu steigern. Schließlich evaluieren wir die Leistung von Mol-R1 im Task der textbasierten Molekül-Reasoning-Generierung und zeigen, dass das Modell gegenüber bestehenden Baselines überlegen ist.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

LLM

Überwachtes Feinabstimmen

KI Für Die Wissenschaft

Forschungsgebiet

Ansatz/Rahmenwerk

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

LLM

Überwachtes Feinabstimmen

KI Für Die Wissenschaft

Forschungsgebiet

Ansatz/Rahmenwerk

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung | Paper | HyperAI

Command Palette

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mol-R1: Hin zu expliziter Lang-CoT-Reasoning in der Molekülentdeckung

Jiatong Li Weida Wang Qinggang Zhang Junxian Li Di Zhang Changmeng Zheng Shufei Zhang Xiaoyong Wei Qing Li

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters