Command Palette
Search for a command to run...
TOMG-Bench: Evaluation von LLMs bei der textbasierten offenen Molekülgenerierung
TOMG-Bench: Evaluation von LLMs bei der textbasierten offenen Molekülgenerierung
Jiatong Li Junxian Li Yunqing Liu Dongzhan Zhou Qing Li
Zusammenfassung
In dieser Arbeit schlagen wir das Textbasierte Offene Molekülgenerierungsbenchmark (TOMG-Bench) vor, den ersten Benchmark zur Bewertung der offenen Molekülgenerierungsfähigkeit von großen Sprachmodellen (LLMs). TOMG-Bench umfasst einen Datensatz mit drei Hauptaufgaben: Moleküleditor (MolEdit), Moleküloptimierung (MolOpt) und personalisierte Molekülgenerierung (MolCustom). Jede Hauptaufgabe enthält drei Teilaufgaben, wobei jede Teilaufgabe 5.000 Testbeispiele umfasst. Angesichts der inhärenten Komplexität der offenen Molekülgenerierung haben wir auch ein automatisiertes Evaluierungssystem entwickelt, das sowohl die Qualität als auch die Genauigkeit der generierten Moleküle misst. Unsere umfassende Benchmarking von 25 LLMs zeigt die aktuellen Einschränkungen und potenziellen Verbesserungsbereiche bei textgeführter Moleküldiscovery auf. Darüber hinaus konnte Llama3.1-8B mit der Unterstützung von OpenMolIns, einem spezialisierten Anweisungstuning-Datensatz, der für die Bewältigung der Herausforderungen von TOMG-Bench vorgeschlagen wurde, alle quelloffenen allgemeinen LLMs übertreffen und sogar GPT-3.5-turbo um 46,5 % in TOMG-Bench übertrumpfen. Unsere Codes und Datensätze sind unter https://github.com/phenixace/TOMG-Bench verfügbar.