Exa 推出新型搜索引擎 Websets,将互联网变成高效数据库
最近,Exa(Y Combinator S21的毕业生)推出了一款名为Websets的搜索引擎,旨在通过语义嵌入技术返回用户精确搜索的内容。这款引擎可以处理复杂查询,例如“所有2021-2025年在旧金山成立的专注开源开发者工具的创业公司”。创始人的初衷是在于他们对目前主流搜索引擎,特别是Google,愈发依赖SEO优化的点击诱饵类内容感到不满,认为这影响了信息检索的质量。 Exa Websets的工作原理较为独特。它不仅仅依靠关键词匹配来搜索,而是利用嵌入模型在Exa的网络向量数据库中找到与查询最相关的候选答案,然后通过智能工作流逐一验证这些答案是否符合用户提出的精确标准。这种机制使得即使是对特定群体或主题的复杂查询也能获得非常精准的结果。 与其他搜索引擎不同的是,Exa特别强调了其“网络作为数据库”的概念。用户可以在返回的结果表中增加“富化”列,如“员工数量”或“作者是否有博客”,进一步挖掘关于每个条目的信息,而这些数据会在表格中标记加载状态,逐步填充完整。 具体来说,Exa Websets采用了两种核心技术来保障其搜索效果。一是自定义训练的嵌入模型,这种模型专门针对查找具体实体进行了优化,能够理解用户的意图而非仅仅是关键字。二是基于大模型的语言模型提供的智能验证服务,确保每一个搜索结果都与用户的需求完全吻合,并提供了支持结果的相关参考文献。不过,这一系列操作可能会使某些查询花费较长时间来完成,但创始人认为对于有价值的搜索请求,这样的等待是值得的。 目前已经有一些实例展示了Websets的强大功能。比如,能够找到“非美国教师创建的数学博客”,筛选出2018至2022年间第一作者名字开头为“A”、“B”、“S”或“T”的关于如何解决Transformer注意力建模中O(n^2)问题的研究论文,或者检索到拥有超过100名员工并且创始人具备技术背景的美国医疗保健企业列表,甚至还可以获取到所有有创业经验、掌握Rust语言并发表过技术内容的湾区软件工程师名单。 Exa团队开放了他们的产品供用户体验,API文档亦已上线。他们希望通过社区的反馈来不断改进和完善这一创新的技术解决方案。 业内人士表示,Exa Websets的推出预示着搜索引擎技术正在迎来一个新的变革期,该技术有望解决当前信息泛滥却难以精确定位的问题,提高用户在海量数据中的搜索效率。作为一家专注于提升在线信息获取质量的技术初创公司,Exa已经获得了不少关注和支持。