详细内容或原文请订阅后点击阅览
使用 Amazon Nova Multimodal Embeddings 统一矢量搜索扩展创意资产发现
在本文中,我们将介绍如何使用 Amazon Nova 多模式嵌入来检索特定视频片段。我们还回顾了一个现实世界的用例,其中 Nova Multimodal Embeddings 在针对 170 个游戏创意资产的库进行测试时,实现了 96.7% 的召回成功率和 73.3% 的高精度召回率(返回前两个结果中的目标内容)。该模型还展示了强大的跨语言功能,并且跨多种语言的性能下降最小。
来源:亚马逊云科技 _机器学习游戏公司在管理广告创意资产方面面临着前所未有的挑战。现代游戏公司为 A/B 测试活动制作数千个视频广告,一些组织维护着包含超过 100,000 个视频资产的库,并且每个月都会以数千个资产的速度增长。这些资产对于用户获取活动至关重要,找到合适的创意资产可以决定成功发布还是代价高昂的失败。
在本文中,我们将介绍如何使用 Amazon Nova 多模式嵌入来检索特定视频片段。我们还回顾了一个现实世界的用例,其中 Nova Multimodal Embeddings 在针对 170 个游戏创意资产的库进行测试时,实现了 96.7% 的召回成功率和 73.3% 的高精度召回率(返回前两个结果中的目标内容)。该模型还展示了强大的跨语言功能,并且跨多种语言的性能下降最小。
传统的创意资源排序、存储和搜索方法无法满足创意团队的动态需求。传统上,创意资产需要手动标记以启用基于关键字的搜索,然后按文件夹层次结构进行组织,然后手动搜索所需的资产。基于关键字的搜索系统需要手动标记,这既费力又不一致。虽然基于 LLM 的自动标记等大型语言模型 (LLM) 解决方案提供了强大的多模式理解功能,但它们无法扩展以满足创意团队在海量资产库中执行各种实时搜索的需求。
解决方案概述
在本部分中,您将了解 Nova Multimodal Embeddings 及其关键功能、优势以及与 AWS 服务的集成,以创建全面的多模态搜索架构。本文描述的多模式搜索架构提供:
