试图将网络变成数据库的搜索初创公司

一家名为 Exa 的初创公司正在推出一种新的生成搜索方法。它利用大型语言模型背后的技术来返回结果列表,并声称这些结果比其竞争对手(包括 Google 和 OpenAI)的结果更准确。其目的是将互联网上混乱的网页变成......

来源:MIT Technology Review _人工智能

“网络是数据的集合,但它很乱,”Exa 联合创始人兼首席执行官 Will Bryk 说。“这里有一段 Joe Rogan 的视频,那里有一篇《大西洋月刊》的文章。没有组织。但我们的梦想是让网络感觉像一个数据库。”

《大西洋月刊》

Websets 面向需要寻找其他搜索引擎不擅长查找的内容(例如人员或公司类型)的高级用户。询问它“制造未来硬件的初创公司”,您会得到一份长达数百页的特定公司列表,而不是提到这些术语的网页的随机链接。Bryk 说,谷歌做不到这一点:“对于投资者或招聘人员,或者任何想要从网络上获取任何类型数据集的人来说,都有很多有价值的用例。”

自从《麻省理工技术评论》在 2021 年爆料谷歌研究人员正在探索在一种新型搜索引擎中使用大型语言模型以来,事情进展很快。这个想法很快就招致了激烈的批评。但科技公司对此并不在意。三年后,谷歌和微软等巨头与 Perplexity 和 OpenAI 等一大批新晋者争夺这一热门新趋势的份额,后者于 10 月推出了 ChatGPT Search。

《麻省理工技术评论》 大型语言模型在新型搜索引擎中的应用 激烈的批评

Exa 尚未试图超越任何一家公司。相反,它提出了一些新的东西。大多数其他搜索公司将大型语言模型包装在现有的搜索引擎上,使用这些模型来分析用户的查询,然后总结结果。但搜索引擎本身并没有太大变化。例如,Perplexity 仍然将其查询定向到 Google Search 或 Bing。可以把今天的人工智能搜索引擎想象成一个面包新鲜但馅料不新鲜的三明治。

不仅仅是关键词

嵌入将单词转换为数字,这样具有相似含义的单词就变成了具有相似值的数字。实际上,这让 Exa 能够捕捉网页上文本的含义,而不仅仅是关键词。