HyperAIHyperAI

Command Palette

Search for a command to run...

TOMG-Bench: Evaluation von LLMs bei der textbasierten offenen Molekülgenerierung

Jiatong Li Junxian Li Yunqing Liu Dongzhan Zhou Qing Li

Zusammenfassung

In dieser Arbeit schlagen wir das Textbasierte Offene Molekülgenerierungsbenchmark (TOMG-Bench) vor, den ersten Benchmark zur Bewertung der offenen Molekülgenerierungsfähigkeit von großen Sprachmodellen (LLMs). TOMG-Bench umfasst einen Datensatz mit drei Hauptaufgaben: Moleküleditor (MolEdit), Moleküloptimierung (MolOpt) und personalisierte Molekülgenerierung (MolCustom). Jede Hauptaufgabe enthält drei Teilaufgaben, wobei jede Teilaufgabe 5.000 Testbeispiele umfasst. Angesichts der inhärenten Komplexität der offenen Molekülgenerierung haben wir auch ein automatisiertes Evaluierungssystem entwickelt, das sowohl die Qualität als auch die Genauigkeit der generierten Moleküle misst. Unsere umfassende Benchmarking von 25 LLMs zeigt die aktuellen Einschränkungen und potenziellen Verbesserungsbereiche bei textgeführter Moleküldiscovery auf. Darüber hinaus konnte Llama3.1-8B mit der Unterstützung von OpenMolIns, einem spezialisierten Anweisungstuning-Datensatz, der für die Bewältigung der Herausforderungen von TOMG-Bench vorgeschlagen wurde, alle quelloffenen allgemeinen LLMs übertreffen und sogar GPT-3.5-turbo um 46,5 % in TOMG-Bench übertrumpfen. Unsere Codes und Datensätze sind unter https://github.com/phenixace/TOMG-Bench verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp