HyperAIHyperAI
il y a 2 mois

Génération de molécules guidée par le texte avec un modèle de langage de diffusion

Haisong Gong; Qiang Liu; Shu Wu; Liang Wang
Génération de molécules guidée par le texte avec un modèle de langage de diffusion
Résumé

La génération de molécules guidée par le texte est une tâche consistant à créer des molécules qui correspondent à des descriptions textuelles spécifiques. Récemment, la plupart des méthodes existantes de génération de molécules basées sur les SMILES s'appuient sur une architecture auto-régressive. Dans cette étude, nous proposons la Génération de Molécules Guidée par le Texte avec Modèle de Diffusion Linguistique (TGM-DLM), une nouvelle approche qui utilise les modèles de diffusion pour surmonter les limites des méthodes auto-régressives. Le TGM-DLM met à jour collectivement et itérativement les plongements de jetons au sein de la chaîne SMILES, en utilisant un processus de génération par diffusion en deux phases. La première phase optimise les plongements à partir d'un bruit aléatoire, guidée par la description textuelle, tandis que la seconde phase corrige les chaînes SMILES invalides pour former des représentations moléculaires valides. Nous montrons que le TGM-DLM surpasses MolT5-Base, un modèle auto-régressif, sans nécessiter de ressources de données supplémentaires. Nos résultats soulignent l'efficacité remarquable du TGM-DLM dans la génération de molécules cohérentes et précises possédant des propriétés spécifiques, ouvrant ainsi de nouvelles perspectives dans la découverte de médicaments et dans les domaines scientifiques connexes. Le code sera publié à : https://github.com/Deno-V/tgm-dlm.

Génération de molécules guidée par le texte avec un modèle de langage de diffusion | Articles de recherche récents | HyperAI