模态数据领域信息情报检索---XiaoMi-AI

2024年10月23日 15:33

RAG GenAI 系统中的多模态数据：从文本到图像及其他

Multimodal Data in RAG GenAI Systems: From Text to Image and Beyond

在快速发展的人工智能领域，检索增强生成 (RAG) GenAI 通过结合实时数据检索突破了生成模型的界限。 RAG 技术与生成式人工智能 (GenAI) 的融合创建了一个动态、上下文丰富的系统，可增强各个行业的内容生成。最具变革性的进步之一是整合 […]

亚马逊云科技 _机器学习

2024年9月11日 00:13

Genomics England 使用 Amazon SageMaker 根据多模态数据预测癌症亚型和患者生存率

Genomics England uses Amazon SageMaker to predict cancer subtypes and patient survival from multi-modal data

在这篇文章中，我们详细介绍了我们在创建两个概念验证 (PoC) 练习方面的合作，这些练习围绕多模态机器学习进行生存分析和癌症亚型分析，使用基因组（基因表达、突变和拷贝数变异数据）和成像（组织病理学幻灯片）数据。我们提供了关于使用 Amazon SageMaker 在 AWS 上构建复杂 ML 工作流的可解释性、稳健性和最佳实践的见解。这些多模态管道正在 Genomics England 癌症队列中使用，以增强我们对癌症生物标志物和生物学的理解。

Clarifai博客 | 实际应用中的人工智能

2025年1月28日 03:46

开源创新时代的推理优化

Optimizing Inference in the Age of Open-Source Innovation

探索十个多模态数据集和基准的主要特征，以评估多模态模型的性能。

Apple机器学习研究

2024年10月18日 00:00

4M-21：适用于数十种任务和模式的任意视觉模型

4M-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities

*平等贡献者当前的多模态和多任务基础模型（如 4M 或 UnifiedIO）显示出了良好的结果，但在实践中，它们接受不同输入和执行不同任务的开箱即用能力受到它们所训练的模态和任务数量（通常相当少）的限制。在本文中，我们通过在数十种高度多样化的模态上对其进行训练以及在大规模多模态数据集和文本语料库上进行联合训练，显著扩展了 4M 的功能。这包括对几种语义和几何模态、特征图的训练......

Clarifai博客 | 实际应用中的人工智能

2024年8月13日 16:39

多模态评估基准概况

The Landscape of Multimodal Evaluation Benchmarks

探索十个多模态数据集和基准的主要特征，以评估多模态模型的性能。

走向数据科学

2024年7月16日 07:11

大型语言模型的 MOE 和 MOA

MOE & MOA for Large Language Models

向专家小组寻求建议图片由作者提供（AI 生成 leonardo.ai）大型语言模型 (LLM) 无疑席卷了科技行业。它们的迅速崛起得益于来自维基百科、网页、书籍、大量研究论文以及我们喜爱的社交媒体平台的用户内容的大量数据。数据和计算密集型模型一直在狂热地整合来自音频和视频库的多模态数据，并且数月来一直在使用数万个 Nvidia GPU 来训练最先进的 (SOTA) 模型。所有这些都让我们怀疑这种指数级增长是否能持续下去。这些 LLM 面临的挑战很多，但让我们在这里探讨一些。成本和可扩展性：较大的模型可能需要花费数千万美元来训练和服务，成为日常应用程序采用的障碍。（参见 GPT-4 的训练成本

The Scientist

2024年7月2日 13:33

连接数据点

Connecting the Data Dots

为了加速研究计划，科学家可以利用一个汇集超过 14 PB 多模态数据的平台。

Apple机器学习研究

2024年6月18日 00:00

用于设备定向语音检测的融合低秩自适应多模态大型语言模型

Multimodal Large Language Models with Fusion Low Rank Adaptation for Device Directed Speech Detection

虽然大型语言模型 (LLM) 已显示出实现类似人类对话的前景，但它们主要是在文本数据上进行预训练的。结合音频或视频可以提高性能，但收集大规模多模态数据和预训练多模态 LLM 具有挑战性。为此，我们提出了一种融合低秩自适应 (FLoRA) 技术，该技术可以有效地调整预训练的单模态 LLM，通过低秩自适应来使用新的、以前未见过的模态。对于设备导向的语音检测，使用 FLoRA，多模态 LLM 实现了相等错误率 (EER) 相对降低 22% ......

美国国防部互动体验

2023年3月31日 18:20

ECOLE：环境驱动的概念学习

ECOLE: Environment-driven Conceptual Learning

项目负责人：William Corvey 博士赞助组织：DARPA网站：https://www.darpa.mil/program/environment-driven-conceptual-learning 项目概要：国防部和情报界需要能够稳健且自动分析大量多模态数据的计算系统。此外，

模态数据关键词检索结果