HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 15 jours

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Haoran Sun Yankai Jiang Zhenyu Tang Yaning Pan et al

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Résumé

La fondation de la science reproductible repose sur des protocoles précis, logiquement structurés et exécutables. La génération autonome de tels protocoles à partir de requêtes en langage naturel pourrait considérablement améliorer l'efficacité du processus de reproductibilité. Toutefois, les modèles de langage massifs (LLM) actuellement les plus performants produisent fréquemment des protocoles incomplets ou incohérents, ce qui limite leur utilité. Pour surmonter cette limitation, nous introduisons d'abord SciRecipe, un grand ensemble de données comprenant plus de 12 000 protocoles structurés couvrant 27 sous-champs biologiques, et incluant à la fois des tâches de compréhension et de résolution de problèmes. Afin d'améliorer davantage la génération de protocoles, nous proposons le paradigme « Sketch-and-Fill » (esquisse et remplissage), qui sépare l'analyse, la structuration et l'expression pour garantir que chaque étape soit explicite et vérifiable. Complétant ce cadre, un mécanisme de récompense basé sur une structure composant-orientée évalue la granularité des étapes, l'ordre des actions et la fidélité sémantique, alignant ainsi l'optimisation du modèle sur la fiabilité expérimentale. En s'appuyant sur ces composants, nous développons Thoth, entraîné selon un processus progressif « Connaissance vers Action », passant de l'acquisition de connaissances à un raisonnement opérationnel, puis à la génération robuste et exécutable de protocoles. Sur plusieurs benchmarks, Thoth dépasse systématiquement à la fois les LLM propriétaires et open-source, obtenant des améliorations significatives en termes d’alignement des étapes, de séquençage logique et d’exactitude sémantique. Notre approche ouvre la voie à des assistants scientifiques fiables, capables de relier connaissances et exécution expérimentale. Tous les données, le code source et les modèles seront publiés librement.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants | Articles de recherche | HyperAI