HyperAI超神经

Résumé de l’Article : Utilisation de l’API d’OpenAI pour la Recherche Profonde Introduction La recherche profonde est une technique émergente qui utilise des modèles de langage génératifs avancés (LLMs) pour analyser de vastes quantités de données sur le web, planifier des étapes de recherche, et auto-corriger leurs actions. Cette méthode améliore considérablement les performances comparées à des LLMs traditionnels, mais elle comporte des limites en termes de coût et d'accès. Par exemple, en juillet 2025, OpenAI limite les utilisateurs de plans Plus, Team, Enterprise et Edu à 25 requêtes de recherche profonde par mois, tandis que les utilisateurs Pro ont droit à 125 requêtes. Les utilisateurs gratuits n'ont même pas accès à la recherche profonde, bien qu'ils puissent effectuer 5 requêtes légères. Bypassing les Limitations avec l’API d’OpenAI Pour éviter ces restrictions flexibles et adopter un modèle de paiement à l'utilisation, il est possible de créer un assistant de recherche profonde personnalisé à partir de l'API d'OpenAI. Deux modèles de recherche profonde sont disponibles via l'API en juillet 2025 : o3-deep-research et o4-mini-deep-research. Ces modèles permettent une utilisation flexible et économique, généralement comprise entre 2 et 5 dollars par rapport. Exemple Pratique Voici un exemple de requête pour étudier l'impact de la semaglutide sur les systèmes de santé mondiaux : python system_message = """Vous êtes un chercheur professionnel chargé de préparer un rapport structuré et basé sur des données pour une équipe mondiale d'économie de la santé. Votre tâche est d'analyser la question de santé posée par l'utilisateur. Soyez analytique, évitez les généralités, et assurez-vous que chaque section se fonde sur des raisonnements soutenus par des données qui peuvent informer les politiques de santé ou les modèles financiers.""" user_query = "Rechercher l'impact de la semaglutide sur les systèmes de santé mondiaux." response = client.responses.create( model="o3-deep-research", input=[ { "role": "developer", "content": [ { "type": "input_text", "text": system_message, } ] }, { "role": "user", "content": [ { "type": "input_text", "text": user_query, } ] } ], reasoning={ "summary": "auto" }, tools=[ { "type": "web_search_preview" }, { "type": "code_interpreter", "container": { "type": "auto", "file_ids": [] } } ]) Architecture et Workflow L'application utilise le cadre d'agents d'OpenAI, mais les phases de workflow sont modifiées pour un fonctionnement plus autonome et itératif. Trois types d'agents sont créés : - ResearchAgent : Lance la recherche profonde. - CritiqueAgent : Critique et challenge le rapport initial. - FinalReportAgent : Consolide les résultats de la recherche et de la critique pour générer un rapport final. Le ResearchAgent commence par lancer une recherche, dont les résultats sont ensuite évalués par le CritiqueAgent. Si la recherche est jugée insuffisante, le CritiqueAgent peut demander un second cycle de recherche. Le workflow se terminant par le FinalReportAgent qui compile les informations et calcule le coût total. Gestion des Limites du Modèle de Recherche Profonde Les modèles de recherche profonde d'OpenAI sont limités en termes d'outils disponibles. Les limitations suivantes ont été abordées : 1. Transfert de Contrôle : Le transfert de contrôle est géré par le code plutôt que par le modèle lui-même pour les transitions entre ResearchAgent et CritiqueAgent. 2. Utilisation des Outils : Les fonctions nécessitant un serveur MCP (Multi-Conversation Protocol) et les outils personnalisés sont déléguées au CritiqueAgent, qui utilise un modèle de raisonnement standard. Événements et Pipelining L'application implémente un parseur d'événements pour intercepter les requêtes de recherche web, les résumés de raisonnement, les appels au serveur MCP et les appels aux outils. Elle collecte également l'utilisation des tokens pour estimer les coûts. Le pipelining permet de séparer et d'optimiser chaque étape du processus, facilitant ainsi la gestion des erreurs et l'amélioration progressive du rapport. Implémentation L'implémentation comprend la création de trois agents distincts : - ResearchAgent : Équipé d'un moteur de recherche web et d'un interpréteur de code. - CritiqueAgent : Utilise un moteur de recherche web, un serveur MCP et une fonction verify_url pour vérifier les URLs. - FinalReportAgent : Synthétise les résultats et génère une estimation de coûts. Le CritiqueAgent est particulièrement important car il s'assure de la précision des données en effectuant des recherches supplémentaires et en utilisant des outils comme verify_url et le serveur MCP pour vérifier les dépôts GitHub mentionnés. Configuration et Modes d’Échec La configuration de l'application consiste principalement à définir les outils et les modèles à utiliser. Les modèles par défaut sont : - MODEL_RESEARCH = "o4-mini-deep-research" - MODEL_CRITIQUE = "o3-pro" - MODEL_FINAL_REPORT = "o4-mini" Le choix des modèles peut être ajusté pour équilibrer la qualité et le coût. Les erreurs courantes incluent des limites de bande passante du serveur OpenAI, notamment pendant les pics d'activité. Dans ce cas, il est recommandé de relancer la requête quelques minutes plus tard. Exemples d’Utilisation Voici un exemple complet d'exécution de l'application pour comparer les mécanismes de transfert d'agents dans Google ADK, LangChain et OpenAI Agents : bash export QUERY="Comparer les mécanismes de transfert d'agents dans Google ADK, LangChain et OpenAI Agents" python agentic_research.py -q "$(echo $QUERY)" -cvri Cette exécution passe par plusieurs phases : - Recherche : Effectue des recherches web et génère des résumés de raisonnement. - Critique : Utilise des outils et le serveur MCP pour valider les sources et corriger les erreurs. - Rapport Final : Compile les résultats et fournit une analyse de coûts. Analyse de Coûts Le rapport final inclut une section d'analyse de performance et de coûts, estampillée par le FinalReportAgent. Voici une estimation typique : ```markdown Analyse des Coûts et des Performances | Modèle | Type de Token | Compte | Tarif (USD par 1M tokens) | Coût (USD) | |--------------------------|---------------|--------:|--------------------------:|------------:| | o4-mini-deep-research | Entrée (payable) | 484,888 | $2.00 | $0.9698 | | | Raisonnement | 19,200 | $2.00 | $0.0384 | | | En cache (gratuit) | 1,343,972 | $0.00 | $0.0000 | | | Sortie | 22,140 | $8.00 | $0.1771 | | | Total | 1,870,200 | | $1.1853 | | o4-mini | Entrée (payable) | 239,264 | $1.10 | $0.2632 | | | Raisonnement | 17,152 | $1.10 | $0.0189 | | | En cache (gratuit) | 1,371,630 | $0.00 | $0.0000 | | | Sortie | 19,526 | $4.40 | $0.0859 | | | Total | 1,647,572 | | $0.3679 | | Sous-total (Recherche + Critique) | | 3,517,772 | | $1.5532 | | Estimation finale (o4-mini) | Entrée | 2,000 | $1.10 | $0.0022 | | | Sortie | 10,000 | $4.40 | $0.0440 | | | Total étape | 12,000 | | $0.0462 | | Total global (toutes les étapes) | | 3,529,772 | | $1.5994 | ``` Évaluation et Profil de l’Entreprise Cet article propose une solution pratique pour utiliser l'API d'OpenAI pour la recherche profonde sans se soumettre aux limitations des plans de souscription. En adoptant un approche hybride et itérative, les utilisateurs peuvent obtenir des rapports de recherche de haute qualité à un coût raisonnable. Cette méthode est particulièrement utile pour les individus et les petites entreprises qui ne disposent pas de gros budgets mais ont besoin d'outils de recherche puissants. Des professionnels de l'industrie apprecient cette approche car elle offre une flexibilité et une économie significative. En effet, les coûts peuvent être largement inférieurs à ceux des plans Pro d'OpenAI, tout en maintenant une qualité de recherche comparable. L'article met également en avant l'importance de la configuration et de la gestion des erreurs pour assurer une utilisation efficace et sans heurts de l'API. Conclusion En résumé, cet article détaille une méthode astucieuse permettant de tirer parti des capacités de recherche profonde d'OpenAI via son API, en circumvenant les limitations des plans de souscription. Les utilisateurs peuvent ainsi accéder à une puissante assistance de recherche tout en optimisant leur budget. Le projet est disponible sur GitHub, ce qui facilite la réutilisation et l'adaptation à des besoins spécifiques.

Comment Bypasser les Limites de ChatGPT Pro avec l’API d’OpenAI pour une Recherche Approfondie Payante à la Demande

Related Links