我们介绍了VARM,va riant r Elationship m atcher策略,以识别电子商务目录中的一对变体产品。实体解决方案的传统定义与产品提及是否是指相同的基础产品。但是,这未能捕获对电子商务应用程序至关重要的产品关系,例如在同一网页上列出的相似但不相同的产品或共享评论。在这里,我们制定了一种在变体产品关系中的新型实体分辨率,以捕获这些相似的电子商务产品链接。与传统的定义相反,新定义既需要识别两个产品是彼此的变体匹配,以及它们之间有什么变化的属性。为了满足这两个要求,我们制定了一种利用编码和生成AI模型的优势的策略。首先,我们构建了一个捕获网页产品链接的数据集,并因此构建了产品关系,以训练编码LLM以预测任何给定的产品的变体匹配。第二,我们使用抹布提示了一代LLM,以在变体产品组之间提取变异和共同属性。为了验证我们的战略,我们使用世界领先的电子商务零售商之一的真实数据评估了模型性能。结果表明,我们的策略超出了替代解决方案,并为利用这些新型产品关系的方式铺平了道路。
主要关键词