细粒关键词检索结果

ETVA:通过细粒度生成和回答

ETVA: Evaluation of Text-to-Video Alignment via Fine-grained Question Generation and Answering

精确评估文本提示和生成视频之间的语义一致性仍然是文本到视频(T2V)一代的挑战。现有的文本到视频对齐指标(例如夹克)仅产生粗粒的分数,而无需细粒度的细节细节,无法与人类偏好保持一致。为了解决这一限制,我们提出了ETVA,这是一种通过细粒度的问题产生和回答的新颖的文本到视频对齐方式的评估方法。首先,一个多代理系统解析提示进入语义场景图以生成原子问题。然后,我们设计了一个知识提升的……

[爬虫学 • 2024] Scinax ritaleeeae • 来自巴西东北部的 Scinax 细粒菌群的新种(无尾目:Hylidae:Hylinae:Scinaxini)

[Herpetology • 2024] Scinax ritaleeae • A New Species of the Scinax granulatus Group (Anura: Hylidae: Hylinae: Scinaxini) from Northeastern Brazil

Scinax ritaleeaeMarinho、Faivovich、Haddad 和 Araujo-Vieira,2024DOI:10.1643/h2024012 x.com/IchsAndHerps我们描述了来自巴西东北部大西洋森林的 Scinax granulatus 组的一个新物种,并将该新物种纳入该组的最新系统发育假说中。新物种与 S. granulatus 组中的所有其他物种的不同之处在于一系列特征,例如弱双裂声囊、中度发育的 Toe IV 前轴和后轴蹼以及广告呼叫特征。新描述的分类单元与 S.tropicalia 更相似,后者是一种不密切相关的物种;两者可以通过新物种的红色虹膜和呼

出版物:细粒度贸易和生产活动 (GRANTPA) 数据库

Publication: The Granular Trade and Production Activities (GRANTPA) Database

本文介绍了粒度贸易和生产活动 (GRANTPA) 数据库,其中涵盖...

厄尔尼诺和拉尼娜过渡会影响热带气旋发展一半的世界

El Niño and La Niña transitions affect tropical cyclone development half a world away

蝴蝶效应表明,系统的小变化可能会对最终结果产生很大的影响。一个用于说明这个概念的隐喻是蝴蝶拍打的翅膀,只是导致飓风跨过海洋。尽管气象学家目前对天气的因果关系并不是这种细粒度的理解,但研究人员正在积极研究温度,降雨,风模式等如何影响世界一半的天气现象。

用古老的潮汐绘制海底

Mapping the ocean floor with ancient tides

在世界各地的浅海水域中,泥浆和其他细粒沉积物,例如粘土和淤泥形成关键的蓝色碳水槽。风力涡轮机和石油平台等海上基础设施以及诸如底部拖网等捕鱼习惯可能会对海底产生重大影响。因此,了解这些泥泞的沉积沉积物的位置是做出沿海管理决策的关键。

使用Amazon Bedrock

Protect sensitive data in RAG applications with Amazon Bedrock

在这篇文章中,我们探讨了使用Amazon Bedrock在抹布应用中确保敏感数据的两种方法。第一种方法着重于在摄入亚马逊基石知识库之前识别和编辑敏感数据,第二种方法显示了一种细粒度的RBAC模式,用于管理检索过程中访问敏感信息的访问。这些解决方案仅代表了在生成AI应用中确保敏感数据的众多方法中的两种可能的方法。

通过传输激活来控制语言和扩散模型

Controlling Language and Diffusion Models by Transporting Activations

大型生成模型变得越来越有能力,并且更广泛地部署到电力生产应用程序中,但是让这些模型确切地产生所需的东西仍然具有挑战性。对这些模型的输出的细粒度控制对于满足用户的期望和减轻潜在的滥用非常重要,从而确保了模型的可靠性和安全性。为了解决这些问题,Apple Machine Learning研究人员开发了一种新技术,该技术具有模态性敏捷性,并通过可忽略的计算开销对模型的行为进行了精细的控制,而…

混合体系结构的艺术

The Art of Hybrid Architectures

将CNN和变压器组合起来以提升细粒度的视觉分类。在迈向数据科学方面,混合体系结构的艺术首先出现。

聚合和调整自然语言提示以实现 CLIP 的下游泛化

Aggregate-and-Adapt Natural Language Prompts for Downstream Generalization of CLIP

大型预训练视觉语言模型(如 CLIP)已显示出良好的泛化能力,但在专业领域(例如卫星图像)或细粒度分类(例如汽车模型)中可能会遇到困难,因为在预训练期间看不到视觉概念或视觉概念代表性不足。即时学习提供了一个参数高效的微调框架,即使在注释数据有限的情况下,也可以使 CLIP 适应下游任务。在本文中,我们通过从自然语言提示(人工或 LLM 生成)中提取文本知识来改进即时学习,以提供……

揭开 Azure 存储帐户网络访问的神秘面纱

Demystifying Azure Storage Account network access

揭开 Azure 存储帐户网络访问的神秘面纱服务端点和私有端点动手实践:包括 Azure Backbone、存储帐户防火墙、DNS、VNET 和 NSG 连接网络 — 图片来自 Unsplash 上的 Nastya Dulhiier1. 简介存储帐户在建立企业数据湖的徽章架构中起着至关重要的作用。它们充当集中式存储库,实现生产者和消费者之间的无缝数据交换。此设置使消费者能够执行数据科学任务并构建机器学习 (ML) 模型。此外,消费者可以将数据用于检索增强生成 (RAG),通过 ChatGPT 等大型语言模型 (LLM) 促进与公司数据的交互。高度敏感的数据通常存储在存储帐户中。在数据科学家和

CtrlSynth:可控图像文本合成,实现数据高效的多模态学习

CtrlSynth: Controllable Image-Text Synthesis for Data-Efficient Multimodal Learning

预训练稳健的视觉或多模态基础模型(例如 CLIP)依赖于大规模数据集,这些数据集可能存在噪声、可能错位且具有长尾分布。先前的研究已显示出通过生成合成样本来扩充数据集的良好结果。但是,它们仅支持特定领域的临时用例(例如,仅支持图像或文本,但不能同时支持两者),并且由于缺乏对合成过程的细粒度控制,数据多样性有限。在本文中,我们设计了一个可控的图像文本合成管道 CtrlSynth,用于数据高效且稳健的……

对比本地化语言图像预训练

Contrastive Localized Language-Image Pre-Training

对比语言-图像预训练 (CLIP) 是一种广受赞誉的方法,用于训练视觉编码器生成图像/文本表示,以促进各种应用。最近,CLIP 已被广泛用作多模态大型语言模型 (MLLM) 的视觉主干,以连接图像输入以进行语言交互。CLIP 作为视觉语言基础模型的成功依赖于在图像级别对齐网络爬取的嘈杂文本注释。然而,这样的标准可能不足以满足需要细粒度视觉表示的下游任务,尤其是……

将在 Woodtick 半岛纳入具有自然特征的潜在工程

Potential Engineering With Nature Features to be Incorporated at Woodtick Peninsula

目的:伍德蒂克半岛是伊利湖西部的一个屏障半岛,正在计划通过放置疏浚物来开展修复活动,以对抗半岛湿地的侵蚀。作为修复工作的一部分,目前正在设计人工礁石,以用作防波堤,防止沿半岛西侧液压放置的细粒材料受到侵蚀。在可能的范围内,最好设计礁石,使其不仅提供侵蚀保护,而且还包含可提供栖息地的功能,从而支持与自然共生® (EWN®) 的目标。EWN 是一个专注于协调自然和工程过程的概念,通过合作高效且可持续地提供经济、环境和社会效益。在沿海环境中,已经使用了一系列防波堤和海岸线防护替代品来改善栖息地。虽然许多替代品已经在海水中成功展示,但很少有结构适用于五大湖的淡水系统。然而,五大湖地区已经进行了多次示范

使用 DocOwl2 优化文档理解:一种新颖的高分辨率压缩架构

Optimizing Document Understanding with DocOwl2: A Novel High-Resolution Compression Architecture

理解多页文档和新闻视频是人类日常生活中的一项常见任务。为了解决这种情况,多模态大型语言模型 (MLLM) 应该具备理解具有丰富视觉文本信息的多幅图像的能力。然而,理解文档图像比自然图像更具挑战性,因为它需要更细粒度的感知。使用 DocOwl2 优化文档理解:一种新颖的高分辨率压缩架构,首次出现在 AI Quantum Intelligence 上。

应用现有工具系统地识别近岸安置地点,以有益地利用密歇根湖的航行沉积物

Application of Existing Tools to Systematically Identify Nearshore Placement Sites for Beneficial Use of Navigation Sediments in Lake Michigan

目的:五大湖包括 140 个联邦维护的港口,每年疏浚计划清理 2-4 百万立方米(3-5 百万立方码)[1] 沉积物。许多小型港口没有定期疏浚,积压的未疏浚沉积物超过 9 百万立方米(12​​ 百万立方码) (USACE-LRD 2021)。当前政策 (Spellmon 2023) 是最大限度地利用沉积物 (BU),目标是到 2030 年使 70% 的联邦航行疏浚量实现有益再利用(即 70/30 目标)。在五大湖,干净的沙子经常被放置在海滩或近岸滨海区,以有益地滋养海岸线,但由于许多港口没有定期疏浚,因此没有计划有益地再利用疏浚沉积物。对于具有细粒或混合沉积物的港口,缺乏现有的 BU 计划尤其

强大的 EDA 工具:分组聚合

A Powerful EDA Tool: Group-By Aggregation

照片由 Mourizal Zativa 在 Unsplash 上拍摄了解如何使用分组聚合从数据中发现见解探索性数据分析 (EDA) 是数据分析师的核心能力。每天,数据分析师的任务都是发现“看不见的”东西,或者从浩瀚的数据中提取有用的见解。在这方面,我想分享一种我认为有助于从数据中提取相关见解的技术:分组聚合。为此,本文的其余部分将安排如下:Pandas 中分组聚合的解释数据集:大都会州际交通大都会交通 EDA分组聚合分组聚合是一种数据处理技术,包含两个步骤。首先,我们根据特定列的值对数据进行分组。其次,我们在分组数据上执行一些聚合操作(例如,求和、平均值、中位数、唯一计数)。当我们的数据很细粒

我们从一年的 LLM 建设中学到了什么(第三部分):策略

What We Learned from a Year of Building with LLMs (Part III): Strategy

我们之前分享了我们在操作 LLM 应用程序时磨练的策略的见解。策略是细粒度的:它们是用于实现特定目标的具体行动。我们还分享了我们对运营的看法:支持战术工作以实现目标的更高级别流程。但这些目标从何而来?这是战略的领域。战略回答 […]

发布通知:2019 年近岸安置研讨会:近岸环境的沉积物滋养

PUBLICATION NOTICE: Nearshore Placement Workshop 2019: Sediment Nourishment of the Nearshore Environment

摘要:沿海海湾研究计划和区域沉积物管理计划共同主办了 2019 年近岸安置研讨会。作为研讨会的一部分,来自美国陆军工程研究与发展中心 (ERDC) 和多个地区的 34 名参与者于 2019 年 1 月 29 日至 30 日在维克斯堡举行会议。召开这次研讨会的目的是促进讨论各地区面临的资源机构和利益相关者对近岸安置的担忧、在近岸安置沉积物的挑战以及未来的研究需求。研讨会包括 ERDC 关于近岸安置科学现状的演讲;美国陆军工程兵部队各地区近岸部署的具体实施;关于近岸安置挑战和潜在前进道路的分组讨论;以及关于成功指标、效益量化、需求陈述 (SON) 和研究优先事项的小组讨论。整个研讨会中反复出现的一