HyperAIHyperAI
vor 2 Monaten

Ein molekulares multimodales Grundmodell, das Moleküle mit natürlicher Sprache in Beziehung setzt

Bing Su; Dazhao Du; Zhao Yang; Yujie Zhou; Jiangmeng Li; Anyi Rao; Hao Sun; Zhiwu Lu; Ji-Rong Wen
Ein molekulares multimodales Grundmodell, das Moleküle mit natürlicher Sprache in Beziehung setzt
Abstract

Obwohl künstliche Intelligenz (KI) in verschiedenen Bereichen erhebliche Fortschritte bei der Verständnis von Molekülen gemacht hat, erwerben bestehende Modelle im Allgemeinen nur eine einzelne kognitive Fähigkeit aus einer einzelnen molekularen Modalität. Da die Hierarchie des molekularen Wissens tiefgreifend ist, lernen sogar Menschen aus verschiedenen Modalitäten, einschließlich intuitiver Diagramme und professioneller Texte, um ihr Verständnis zu fördern. Inspiriert durch diesen Ansatz, schlagen wir ein molekulares multimodales Grundmodell vor, das durch kontrastives Lernen anhand von molekularen Graphen und ihren semantisch verwandten textuellen Daten (aus veröffentlichten Papers des Science Citation Index gekrochen) vortrainiert wird. Dieses KI-Modell stellt einen entscheidenden Versuch dar, der molekulare Graphen und natürliche Sprache direkt verbindet. Wichtig ist, dass unser Modell durch die Erfassung spezifischer und komplementärer Informationen der beiden Modalitäten ein tieferes Verständnis der molekularen Expertise erreichen kann. Experimentelle Ergebnisse zeigen, dass unser Modell nicht nur vielversprechende Leistungen in cross-modalen Aufgaben wie cross-modaler Retrieval und Molekülkapitelung aufweist, sondern auch die Vorhersage von molekularen Eigenschaften verbessert und die Fähigkeit besitzt, sinnvolle molekulare Graphen aus natürlichsprachlichen Beschreibungen zu generieren. Wir glauben, dass unser Modell einen weitreichenden Einfluss auf KI-gestützte Bereiche in verschiedenen Disziplinen wie Biologie, Chemie, Materialwissenschaften, Umweltwissenschaften und Medizin haben wird.请注意,"Molekülkapitelung" 是 "molecule caption" 的直译,但这个术语在德语中并不常用。如果需要更符合德语习惯的表达,可以将其替换为 "Moleküldarstellung" 或 "Beschreibung von Molekülen"。以下是调整后的版本:Obwohl künstliche Intelligenz (KI) in verschiedenen Bereichen erhebliche Fortschritte bei der Verständnis von Molekülen gemacht hat, erwerben bestehende Modelle im Allgemeinen nur eine einzelne kognitive Fähigkeit aus einer einzelnen molekularen Modalität. Da die Hierarchie des molekularen Wissens tiefgreifend ist, lernen sogar Menschen aus verschiedenen Modalitäten, einschließlich intuitiver Diagramme und professioneller Texte, um ihr Verständnis zu fördern. Inspiriert durch diesen Ansatz, schlagen wir ein molekulares multimodales Grundmodell vor, das durch kontrastives Lernen anhand von molekularen Graphen und ihren semantisch verwandten textuellen Daten (aus veröffentlichten Papers des Science Citation Index gekrochen) vortrainiert wird. Dieses KI-Modell stellt einen entscheidenden Versuch dar, der molekulare Graphen und natürliche Sprache direkt verbindet. Wichtig ist, dass unser Modell durch die Erfassung spezifischer und komplementärer Informationen der beiden Modalitäten ein tieferes Verständnis der molekularen Expertise erreichen kann. Experimentelle Ergebnisse zeigen, dass unser Modell nicht nur vielversprechende Leistungen in cross-modalen Aufgaben wie cross-modalem Retrieval und Beschreibung von Molekülen aufweist, sondern auch die Vorhersage von molekularen Eigenschaften verbessert und die Fähigkeit besitzt, sinnvolle molekulare Graphen aus natürlichsprachlichen Beschreibungen zu generieren. Wir glauben, dass unser Modell einen weitreichenden Einfluss auf KI-gestützte Bereiche in verschiedenen Disziplinen wie Biologie, Chemie, Materialwissenschaften, Umweltwissenschaften und Medizin haben wird.

Ein molekulares multimodales Grundmodell, das Moleküle mit natürlicher Sprache in Beziehung setzt | Neueste Forschungsarbeiten | HyperAI