HyperAIHyperAI
il y a 2 mois

LDMol : Un modèle de diffusion text-to-molecule avec un espace latent informatif structuralement surpassant les modèles AR

Jinho Chang; Jong Chul Ye
LDMol : Un modèle de diffusion text-to-molecule avec un espace latent informatif structuralement surpassant les modèles AR
Résumé

Avec l'émergence des modèles de diffusion comme modèle génératif de première ligne, de nombreux chercheurs ont proposé des techniques de génération moléculaire utilisant des modèles de diffusion conditionnels. Cependant, la discrétion inévitable d'une molécule rend difficile pour un modèle de diffusion d'établir une connexion entre les données brutes et des conditions hautement complexes telles que le langage naturel. Pour remédier à cela, nous présentons ici un nouveau modèle de diffusion latente appelé LDMol pour la génération moléculaire conditionnée par du texte. En reconnaissant que la conception appropriée de l'espace latent est la clé du rendement du modèle de diffusion, nous utilisons une stratégie d'apprentissage par contraste pour extraire un nouvel espace de caractéristiques à partir des données textuelles qui intègre les caractéristiques uniques de la structure moléculaire. Les expériences montrent que LDMol surpasse les baselines autorégressives existantes sur le banc d'essai de génération text-to-molecule, constituant l'un des premiers modèles de diffusion à surpasser les modèles autorégressifs dans la génération de données textuelles grâce à un meilleur choix du domaine latent. De plus, nous démontrons que LDMol peut être appliqué à des tâches en aval telles que la recherche text-to-molecule et l'édition guidée par du texte, illustrant ainsi sa polyvalence en tant que modèle de diffusion.

LDMol : Un modèle de diffusion text-to-molecule avec un espace latent informatif structuralement surpassant les modèles AR | Articles de recherche récents | HyperAI