语义领域信息情报检索---XiaoMi-AI

2026年5月25日 13:30

从 TF-IDF 到 Transformers：实现四代语义搜索

From TF-IDF to Transformers: Implementing Four Generations of Semantic Search

语义搜索如何从简单的关键字匹配演变为现代基于转换器的语言理解？这篇实践文章使用 Python 逐步构建了四代语义搜索系统。从 TF-IDF 到 Transformers：实现四代语义搜索的帖子首先出现在 Towards Data Science 上。

OSP网站大数据新闻

2026年5月12日 12:32

Oracle 提供语义搜索，无需 LLM

Oracle предлагает семантический поиск без LLM

系统理解自然语言的问题，立即提供必要的文档。

Apple机器学习研究

2026年5月7日 00:00

用于学习语义丰富的视觉表示的文本条件 JEPA

Text-Conditional JEPA for Learning Semantically Rich Visual Representations

基于图像的联合嵌入预测架构 (I-JEPA) 提供了一种通过屏蔽特征预测进行视觉自监督学习的有前途的方法。然而，由于屏蔽位置固有的视觉不确定性，特征预测仍然具有挑战性，并且可能无法学习语义表示。在这项工作中，我们提出了文本条件 JEPA（TC-JEPA），它使用图像标题来减少预测的不确定性。具体来说，我们使用细粒度文本调节器来调整预测的补丁特征，该调节器计算输入文本标记上的稀疏交叉注意力。有了这样的……

走向数据科学

2026年5月29日 16:30

RAG 正在烧钱 - 我构建了一个成本控制层来解决它

RAG Is Burning Money — I Built a Cost Control Layer to Fix It

大多数 RAG 系统都是针对答案质量而不是成本进行优化的，而盲点的成本很快就会变得昂贵。在本文中，我分解了一个结合了语义缓存、查询路由、令牌预算和熔断的生产就绪成本控制层，在不牺牲答案质量的情况下实现了 LLM 成本降低 85%。帖子《RAG 正在烧钱 — 我构建了一个成本控制层来修复它》首先出现在《走向数据科学》上。

走向数据科学

2026年5月19日 17:43

程序员精益简介

Introduction to Lean for Programmers

数学的语法和语义这篇文章《程序员精益简介》首先出现在《走向数据科学》上。

走向数据科学

2026年5月19日 12:00

代理指针 RAG：解决大型知识图中的实体和关系蔓延

Proxy-Pointer RAG: Solving Entity and Relationship Sprawl in Large Knowledge Graphs

用于实体和关系协调的可扩展语义本地化层代理指针 RAG：解决大型知识图中的实体和关系蔓延问题首先出现在走向数据科学上。

亚马逊云科技 _机器学习

2026年5月18日 15:37

将 Atlassian Confluence Cloud 与 Amazon Quick 集成

Integrate Atlassian Confluence Cloud with Amazon Quick

在本文中，您将了解如何设置 Confluence Cloud 与 Quick 集成。这包括创建用于语义搜索的知识库、设置操作来查询和管理 Confluence 页面以及在 Quick Spaces 中组织资源。快速与您当前的企业技术堆栈集成，从内部知识存储库和企业内联网到关键业务应用程序和 AWS 数据服务。

Robogeek新闻频道（关于机器人技术的俄罗斯与世界新闻）

2026年4月16日 16:31

俄罗斯科学家教推荐系统更好地了解用户

Российские ученые научили рекомендательные системы глубже понимать пользователей

俄罗斯储蓄银行实用人工智能中心的科学家与 AIRI 研究所、Innopolis 大学和 ITMO 的研究人员一起，找到了一种将深层语义知识从大型语言模型转移到紧凑推荐系统的方法。对于用户来说，这增加了选择商品、电影和其他内容的准确性，并且不会减慢服务的运行——发布推荐的速度保持在原始轻模型的水平。

走向数据科学

2026年5月12日 15:00

生产 RAG 中的混合搜索和重新排名

Hybrid Search and Re-Ranking in Production RAG

当语义搜索对于 RAG 来说还不够时，生产 RAG 中的混合搜索和重新排名一文首先出现在 Towards Data Science 上。

走向数据科学

2026年5月11日 19:44

学习词向量进行情感分析：Python 再现

Learning Word Vectors for Sentiment Analysis: A Python Reproduction

如何使用语义学习、星级评定和线性 SVM 分类从 IMDb 评论中构建情感感知词表示用于情感分析的学习词向量：Python 再现首先出现在《走向数据科学》上。

Apple机器学习研究

2026年4月28日 00:00

StereoFoley：从视频生成对象感知立体声音频

StereoFoley: Object-Aware Stereo Audio Generation from Video

我们推出了 StereoFoley，这是一种视频到音频生成框架，可在 48 kHz 下产生语义对齐、时间同步和空间精确的立体声。虽然最近的生成视频到音频模型实现了强大的语义和时间保真度，但由于缺乏专业混合、空间精确的视频到音频数据集，它们在很大程度上仍然局限于单声道或无法提供对象感知的立体成像。首先，我们开发和训练一个从视频生成立体声音频的基本模型，在语义准确性和同步方面实现了最先进的水平。下一步...

语义关键词检索结果