il y a 8 mois

Résumé

Les grands modèles de raisonnement (LRM), tels qu’OpenAI-o1, ont démontré des capacités impressionnantes de raisonnement étendu et étape par étape grâce à un apprentissage par renforcement à grande échelle. Toutefois, leurs processus de raisonnement prolongés souffrent souvent d’un manque de connaissances, entraînant des incertitudes fréquentes et des erreurs potentielles. Pour remédier à cette limitation, nous introduisons Search-o1, un cadre qui améliore les LRMs grâce à un mécanisme de génération augmentée par récupération (RAG) agissant de manière autonome, ainsi qu’un module Reason-in-Documents conçu pour affiner les documents récupérés. Search-o1 intègre un flux de travail de recherche autonome dans le processus de raisonnement, permettant une récupération dynamique de connaissances externes lorsque les LRMs rencontrent des points de connaissance incertains. En outre, en raison de la longueur des documents récupérés, nous avons conçu un module distinct, Reason-in-Documents, pour analyser en profondeur les informations récupérées avant leur injection dans la chaîne de raisonnement, réduisant ainsi le bruit et préservant un flux de raisonnement cohérent. Des expérimentations étendues sur des tâches complexes de raisonnement en sciences, mathématiques et programmation, ainsi que sur six benchmarks de questions-réponses à domaine ouvert, démontrent la performance élevée de Search-o1. Cette approche renforce la fiabilité et l’applicabilité des LRMs dans les tâches de raisonnement complexes, ouvrant la voie à des systèmes intelligents plus fiables et polyvalents. Le code est disponible à l’adresse suivante : https://github.com/sunnynexus/Search-o1.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Génération Augmentée Par La Recherche

Agent

Reasoning

Approche/Framework

Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Génération Augmentée Par La Recherche

Agent

Reasoning

Approche/Framework

Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Search-o1 : Modèles de raisonnement massifs améliorés par une recherche agente | Articles | HyperAI

Command Palette

Search-o1 : Modèles de raisonnement massifs améliorés par une recherche agente

Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Search-o1 : Modèles de raisonnement massifs améliorés par une recherche agente

Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Search-o1 : Modèles de raisonnement massifs améliorés par une recherche agente

Xiaoxi Li Guanting Dong Jiajie Jin Yuyao Zhang Yujia Zhou Yutao Zhu Peitian Zhang Zhicheng Dou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters