检索关键词检索结果

引入 Amazon Bedrock 知识库的多模式检索

Introducing multimodal retrieval for Amazon Bedrock Knowledge Bases

在这篇文章中,我们将指导您构建多模式 RAG 应用程序。您将了解多模式知识库的工作原理、如何根据内容类型选择正确的处理策略,以及如何使用控制台和代码示例来配置和实现多模式检索。

时间序列检索:回顾如何改进预测

Retrieval for Time-Series: How Looking Back Improves Forecasts

为什么检索有助于时间序列预测 我们都知道它是怎么回事:时间序列数据很棘手。传统的预测模型对突然的市场崩盘、黑天鹅事件或罕见的天气模式等事件没有做好准备。即使像 Chronos 这样的大型花哨模型有时也会遇到困难,因为它们以前没有处理过这种模式。我们可以[…]帖子检索时间序列:如何回顾改进预测首先出现在走向数据科学上。

您的 RAG 可能还不需要矢量数据库

You Probably Don’t Need a Vector Database for Your RAG — Yet

Numpy 或 SciKit-Learn 可能会满足您所有的检索需求这篇文章《您可能不需要 RAG 的矢量数据库 — 然而》首先出现在《走向数据科学》上。

特朗普的招生数据收集给大学管理人员带来压力

Trump’s admissions data collection strains college administrators

Lynette Duncan 没想到在过去的两周里花了 20 个小时挖掘封存的计算机系统,试图检索 2019 年的招生数据。Duncan 是约翰·布朗大学的机构研究主任,这是一所位于阿肯色州西北部的小型基督教大学,距离沃尔玛总部一小时车程。她经营着一个单人办公室[……]特朗普的招生数据收集给大学管理人员带来压力的帖子首先出现在《赫钦格报告》上。

使用 Amazon Nova Multimodal Embeddings 统一矢量搜索扩展创意资产发现

Scale creative asset discovery with Amazon Nova Multimodal Embeddings unified vector search

在本文中,我们将介绍如何使用 Amazon Nova 多模式嵌入来检索特定视频片段。我们还回顾了一个现实世界的用例,其中 Nova Multimodal Embeddings 在针对 170 个游戏创意资产的库进行测试时,实现了 96.7% 的召回成功率和 73.3% 的高精度召回率(返回前两个结果中的目标内容)。该模型还展示了强大的跨语言功能,并且跨多种语言的性能下降最小。

TDS 时事通讯:是时候重新审视 RAG 了吗?

TDS Newsletter: Is It Time to Revisit RAG?

让我们了解检索增强生成的当前状态TDS 后通讯:是时候重新审视 RAG 了吗?首先出现在《走向数据科学》上。

搜索增强大型语言模型中的过度搜索

Over-Searching in Search-Augmented Large Language Models

搜索增强型大语言模型(LLM)通过集成外部检索,擅长知识密集型任务。然而,它们经常过度搜索——不必要地调用搜索工具,即使它不能提高响应质量,这会导致计算效率低下,并因合并不相关的上下文而产生幻觉。在这项工作中,我们对跨多个维度的过度搜索进行了系统评估,包括查询类型、模型类别、检索条件和多轮对话。我们的发现表明:(i) 搜索通常可以提高……的答案准确性

DeepMMSearch-R1:在多模式网络搜索中为多模式法学硕士提供支持

DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search

现实应用中的多模态大型语言模型 (MLLM) 需要访问外部知识源,并且必须保持对动态且不断变化的现实世界信息的响应,以便解决信息查找和知识密集型用户查询。现有的方法,例如检索增强生成 (RAG) 方法、搜索代理和配备搜索的 MLLM,通常会遇到僵化的管道、过多的搜索调用和构造不良的搜索查询,从而导致效率低下和结果不佳。为了解决这些限制,我们提出......

动物毒液作为肽库用于发现抗胶质母细胞瘤药物

Animal Venoms as Peptide Libraries for the Discovery of Antiglioblastoma Agents

动物毒液作为肽库用于发现抗胶质母细胞瘤药物摘要胶质母细胞瘤是最具侵袭性和广泛认可的脑肿瘤类型之一,其特征是显着的细胞和分子多样性以及固有的侵袭性。该治疗仍然极具挑战性,效果有限且存活率持续较低。因此,研究人员通过探索动物毒液等复杂来源并结合计算机工具来加速发现,不断扩大抗癌剂的化学空间。事实上,毒液作为蛋白质和肽库,为胶质母细胞瘤治疗提供了丰富的新型化学结构来源。一些评论文章研究了毒液衍生肽靶向胶质母细胞瘤细胞系的机制;然而,关键的结构见解和计算分析仍未得到充分探索。在这个人工智能 (AI) 和计算机方法进步的时代,我们的综述记录了毒液肽的抗胶质母细胞瘤特性,并强调了计算方法在基于肽的药物开发

块大小作为 RAG 系统中的实验变量

Chunk Size as an Experimental Variable in RAG Systems

通过试验不同的块大小来理解 RAG 系统中的检索《块大小作为 RAG 系统中的实验变量》一文首先出现在《走向数据科学》上。

使用 Amazon Bedrock Data Automation 以编程方式创建 IDP 解决方案

Programmatically creating an IDP solution with Amazon Bedrock Data Automation

在本文中,我们将探讨如何以编程方式创建使用 Strands SDK、Amazon Bedrock AgentCore、Amazon Bedrock 知识库和 Bedrock Data Automation (BDA) 的 IDP 解决方案。该解决方案通过 Jupyter 笔记本提供,使用户能够上传多模式业务文档并使用 BDA 作为解析器提取见解,以检索相关块并增强对基础模型 (FM) 的提示。

印度一个破碎的机构

A broken institution in India

印度创建武装部队法庭(AFT)是一件非常好的事情;迟到总比不到好,因为政府花了很多年才根据法律委员会的建议采取行动。遗憾的是,AFT 和其他印度法院一样,已经不堪重负。普拉吉亚·辛格(Pragya Singh)在《火线》(The Wire)上发表的这篇毁灭性的、甚至是低调的文章讲述了这个故事。 AFT 有超过 28,000 起案件正在审理中。摘录:毕竟,尽管该法庭的支出逐年增加,但 AFT 积压的案件仍在增加。预算和支出记录(纳亚克还从历年的联邦预算文件中检索)显示,法庭的年度支出从2012-2013年的206.8亿卢比增加到2022-2023年的4822万卢比。 2025-26 年的预算估算

AgREE:新兴实体知识图补全的代理推理

AgREE: Agentic Reasoning for Knowledge Graph Completion on Emerging Entities

开放领域知识图谱补全(KGC)在不断变化的世界中面临着重大挑战,特别是考虑到每日新闻中不断出现新实体时。现有的 KGC 方法主要依赖于预训练语言模型的参数知识、预构建的查询或单步检索,通常需要大量的监督和训练数据。即便如此,他们通常无法捕获有关不受欢迎和/或新兴实体的全面且最新的信息。为此,我们介绍了新兴实体的代理推理(AgREE),这是一本小说……