Yandex 推出新版搜索

Yandex 推出了新版本的搜索。它基于 Korolev 搜索算法 - 使用神经网络,比较请求和网页的含义。因此,搜索能够准确理解用户的需求,并更准确地回答复杂的问题。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

Yandex 推出了新版本的搜索。它基于 Korolev 搜索算法 - 使用神经网络,比较请求和网页的含义。因此,搜索能够准确理解用户的需求,并更准确地回答复杂的问题。

新版本的搜索更广泛地使用搜索统计数据,并考虑了 Yandex.Toloka 用户评分。

去年,Yandex 引入了 Palekh 算法,迈出了意义搜索的第一步 - 它实时比较查询的含义和网页标题。科罗廖夫使用神经网络不仅分析标题,还分析整个页面。这是一项复杂的计算任务,因此 Yandex 在索引阶段提前确定页面的本质。因此,搜索与查询进行意义比较的页面数量已从 150 个文档增加到 20 万个。 Korolev的另一个重要特征是,除了比较查询和页面的含义之外,它还考虑到人们访问它的其他查询的含义。

为了让神经网络评估查询和文档的语义接近度,它需要大量的示例。这些例子是由客观的搜索统计数据提供的:人们根据查询访问哪些网站以及他们在那里花费了多少时间。因此,如果一个人访问某个页面并查看它一段时间,很可能它的含义与请求很接近。 Yandex 使用数百万人的搜索统计数据来学习理解语义连接。例如,他会理解查询[天空漩涡的绘画]是关于梵高的一幅画,而查询[来自蒙古的懒猫]是关于帕拉斯的猫。

“搜索是一个非常复杂的系统。数千名工程师正在努力确保它理解人们并帮助解决他们的问题。在科罗廖夫,我们将机器智能与数百万人的努力结合起来。我们的用户通过提出问题并帮助训练我们的算法来与我们一起改进搜索,”Yandex 搜索负责人 Andrey Styskin 说道。