From TF-IDF to Transformers: Implementing Four Generations of Semantic Search
语义搜索如何从简单的关键字匹配演变为现代基于转换器的语言理解?这篇实践文章使用 Python 逐步构建了四代语义搜索系统。从 TF-IDF 到 Transformers:实现四代语义搜索的帖子首先出现在 Towards Data Science 上。
Text-Conditional JEPA for Learning Semantically Rich Visual Representations
基于图像的联合嵌入预测架构 (I-JEPA) 提供了一种通过屏蔽特征预测进行视觉自监督学习的有前途的方法。然而,由于屏蔽位置固有的视觉不确定性,特征预测仍然具有挑战性,并且可能无法学习语义表示。在这项工作中,我们提出了文本条件 JEPA(TC-JEPA),它使用图像标题来减少预测的不确定性。具体来说,我们使用细粒度文本调节器来调整预测的补丁特征,该调节器计算输入文本标记上的稀疏交叉注意力。有了这样的……
RAG Is Burning Money — I Built a Cost Control Layer to Fix It
大多数 RAG 系统都是针对答案质量而不是成本进行优化的,而盲点的成本很快就会变得昂贵。在本文中,我分解了一个结合了语义缓存、查询路由、令牌预算和熔断的生产就绪成本控制层,在不牺牲答案质量的情况下实现了 LLM 成本降低 85%。 帖子《RAG 正在烧钱 — 我构建了一个成本控制层来修复它》首先出现在《走向数据科学》上。
Proxy-Pointer RAG: Solving Entity and Relationship Sprawl in Large Knowledge Graphs
用于实体和关系协调的可扩展语义本地化层代理指针 RAG:解决大型知识图中的实体和关系蔓延问题首先出现在走向数据科学上。
Integrate Atlassian Confluence Cloud with Amazon Quick
在本文中,您将了解如何设置 Confluence Cloud 与 Quick 集成。这包括创建用于语义搜索的知识库、设置操作来查询和管理 Confluence 页面以及在 Quick Spaces 中组织资源。快速与您当前的企业技术堆栈集成,从内部知识存储库和企业内联网到关键业务应用程序和 AWS 数据服务。
Российские ученые научили рекомендательные системы глубже понимать пользователей
俄罗斯储蓄银行实用人工智能中心的科学家与 AIRI 研究所、Innopolis 大学和 ITMO 的研究人员一起,找到了一种将深层语义知识从大型语言模型转移到紧凑推荐系统的方法。对于用户来说,这增加了选择商品、电影和其他内容的准确性,并且不会减慢服务的运行——发布推荐的速度保持在原始轻模型的水平。
Hybrid Search and Re-Ranking in Production RAG
当语义搜索对于 RAG 来说还不够时,生产 RAG 中的混合搜索和重新排名一文首先出现在 Towards Data Science 上。
Learning Word Vectors for Sentiment Analysis: A Python Reproduction
如何使用语义学习、星级评定和线性 SVM 分类从 IMDb 评论中构建情感感知词表示用于情感分析的学习词向量:Python 再现首先出现在《走向数据科学》上。
StereoFoley: Object-Aware Stereo Audio Generation from Video
我们推出了 StereoFoley,这是一种视频到音频生成框架,可在 48 kHz 下产生语义对齐、时间同步和空间精确的立体声。虽然最近的生成视频到音频模型实现了强大的语义和时间保真度,但由于缺乏专业混合、空间精确的视频到音频数据集,它们在很大程度上仍然局限于单声道或无法提供对象感知的立体成像。首先,我们开发和训练一个从视频生成立体声音频的基本模型,在语义准确性和同步方面实现了最先进的水平。下一步...