HyperAI
Back to Headlines

Exa (YC S21) Transforme le Web en Base de Données avec son Moteur de Recherche Avancé

il y a un mois

Bonjour à tous ! Nous sommes Will et Jeff, cofondateurs d'Exa (https://exa.ai). Nous avons récemment lancé Exa Websets, une engine de recherche novatrice qui exploite l'intelligence des modèles d'embeddings pour fournir exactement ce que vous recherchez. Avec Exa Websets, il est possible d'obtenir des résultats précis pour des requêtes complexes, comme « toutes les startups travaillant sur des outils de développement open source basées à San Francisco et fondées entre 2021 et 2025 ». Notre démonstration est disponible ici : https://youtu.be/Unt8hJmCxd4 Le projet Exa trouve son origine dans notre frustration face au déclin de la pertinence des résultats de recherche sur Google, malgré les avancées rapides des modèles linguistiques d'apprentissage automatique (LLM). Autrefois, internet ressemblait à un portail d'information magique, mais la propagation du contenu optimisé pour le référencement (SEO) et destiné à accroître le clic a rendu cette expérience beaucoup moins agréable. Nous avons donc décidé de développer une solution qui repose sur une approche différente et plus précise pour la recherche d'informations. L'essence de Websets réside dans sa capacité à effectuer de nombreuses recherches d'embeddings sur la base de données vectorielle d'Exa, comprenant l'ensemble du web, afin de sélectionner les meilleurs candidats de recherche. Ensuite, nous mettons en œuvre des workflows agencés sur chaque résultat pour vérifier qu'il correspond exactement à votre demande. Cette double approche garantit une pertinence sans pareille des résultats de recherche. Websets offre une qualité supérieure pour deux raisons principales. Tout d’abord, nous entraînons des modèles d'embeddings personnalisés pour notre algorithme de recherche principal. Contrairement aux moteurs de recherche traditionnels qui se basent sur l'appariement de mots-clés, nos modèles d'embeddings sont spécifiquement formés pour reconnaître le type d'entité que vous cherchez. Par exemple, si vous recherchez « startups travaillant sur la nanotechnologie », un moteur de recherche par mots-clés vous renverra des articles répertoriant ces startups, tandis qu'Exa Websets vous affichera directement les pages d'accueil des startups pertinentes, car elles correspondent à la signification de votre requête. La deuxième raison réside dans l'intelligence des modèles linguistiques (LLMs) qui nous permettent de valider chaque résultat. Chaque entrée et chaque morceau de données sont accompagnés de références de validation, assurant ainsi l'exactitude des résultats par rapport à vos critères de recherche. Ceci explique pourquoi une recherche Websets peut prendre plusieurs minutes, voire des heures, en fonction de la complexité de votre requête et du nombre de résultats demandés. Pour les recherches à forte valeur ajoutée, nous pensons que cet investissement de temps est justifié. Une particularité notable de Websets est qu'il présente ses résultats sous forme de tableaux plutôt que de listes. Vous avez la possibilité d'ajouter des colonnes d'"enrichissement" pour obtenir plus d'informations sur chaque résultat, telles que « nombre d'employés » ou « l'auteur a-t-il un blog ? ». Les cellules de ces colonnes se chargent de manière asynchrone, offrant une interface plus fluide et semblable à une base de données. Voici quelques exemples de requêtes que vous pouvez tester avec Websets : « Math blogs créés par des enseignants hors des États-Unis » : https://websets.exa.ai/cma1oz9xf007sis0ipzxgbamn « Article de recherche sur les moyens d'éviter le problème de l'attention O(n²) dans les transformateurs, où le prénom du premier auteur commence par "A", "B", "S" ou "T", et qui a été écrit entre 2018 et 2022 » : https://websets.exa.ai/cm7dpml8c001ylnymum4sp11h « Sociétés de santé basées aux États-Unis, avec plus de 100 employés et un fondateur technique » : https://websets.exa.ai/cm6lc0dlk004ilecmzej76qx2 « Tous les ingénieurs logiciels de la Baie de San Francisco, avec une expérience en startups, maîtrisant Rust et ayant déjà publié du contenu technique » : https://youtu.be/knjrlm1aibQ Vous pouvez essayer Websets sur notre site : https://websets.exa.ai/ et consulter la documentation de notre API ici : https://docs.exa.ai/websets. Nous serions ravis d'avoir vos retours ! Merci d'avance pour votre intérêt et vos commentaires.

Related Links