Gemini API lance un outil de recherche de fichiers intégré, simplifiant la mise en œuvre de RAG avec une facturation transparente
Nous lançons aujourd’hui l’outil de recherche de fichiers intégré à l’API Gemini, un système RAG entièrement géré qui simplifie considérablement l’exploitation de vos données. Conçu pour vous permettre de vous concentrer sur la création, cet outil intègre directement dans l’API Gemini une solution de recherche de documents puissante, fiable et facile à mettre en œuvre. Grâce à File Search, vous pouvez ancrer les réponses de Gemini dans vos propres données, obtenir des résultats plus précis, pertinents et vérifiables. Pour rendre cet outil accessible et abordable à tous les développeurs, nous avons adopté une nouvelle approche tarifaire : le stockage des fichiers et la génération des embeddings sont désormais gratuits au moment des requêtes. Vous ne payez uniquement lors de l’indexation initiale des fichiers, au tarif fixe de 0,15 $ par million de tokens (ou selon le coût du modèle d’embedding utilisé, ici gemini-embedding-001). Cette stratégie économique permet de développer et d’échelonner facilement vos applications sans surcharge financière. Comment fonctionne File Search ? File Search accélère votre cycle de développement en gérant automatiquement l’ensemble du pipeline RAG, sans nécessiter de configuration complexe. Expérience développeur simple et intégrée : Tout est regroupé dans l’appel standard generateContent. L’outil prend en charge automatiquement le stockage des fichiers, les stratégies d’agrégation optimales, la génération des embeddings et l’injection dynamique du contexte récupéré dans votre prompt. Aucune infrastructure supplémentaire à gérer. Recherche vectorielle avancée : Grâce à notre modèle d’embedding Gemini le plus récent, File Search comprend le sens et le contexte des requêtes. Il peut retrouver des informations pertinentes même lorsque les mots exacts ne sont pas présents dans les documents. Citations intégrées : Les réponses générées incluent automatiquement des références précises indiquant les parties des documents utilisées. Cela facilite grandement la vérification et renforce la transparence. Support de nombreux formats : Vous pouvez constituer une base de connaissances complète à partir d’un large éventail de formats : PDF, DOCX, TXT, JSON, ainsi que de nombreux types de fichiers de code courants (voir la liste complète dans la documentation). Vous pouvez découvrir File Search en action via une nouvelle application démo disponible dans Google AI Studio (requiert une clé API payante). Ce nouvel outil marque une avancée majeure pour les développeurs souhaitant intégrer rapidement et efficacement des connaissances spécifiques à leurs applications, tout en bénéficiant d’une performance optimale et d’une traçabilité claire.
