建立一个基于计算机视觉的资产库存应用程序,没有培训或没有培训

在这篇文章中,我们提出了一种使用生成AI和大型语言模型(LLM)的解决方案,以减轻构建计算机视觉应用程序所需的耗时和劳动密集型的任务,使您能够立即开始拍摄资产标签的照片并提取必要的信息,以使用AWS服务

来源:亚马逊云科技 _机器学习
将最新的资产清单与现场部署的真实设备保持一项具有挑战性且耗时的任务。许多电力提供商使用制造商的标签作为关键信息,将其物理资产链接在资产库存系统中。计算机视觉可以是通过自动从标签中提取相关数据来加快操作员检查并减少人体错误的可行解决方案。但是,构建能够管理数百种不同类型标签的标准计算机视觉应用程序可能是一项复杂且耗时的努力。在这篇文章中,我们提出了一种使用生成性AI和大型语言模型(LLMS)的解决方案Lambda,Amazon Bedrock,Amazon Titan,Anthropic的Amazon Bedrock上的Claude 3,Amazon API Gateway,AWS Amplify,Amazon Simple Storage Service(Amazon S3)和Amazon DynamoDB.llms和Amazon DynamodB.llms是大型深度学习模型,这些模型是大量数据预先培训的。他们能够理解和生成类似人类的文本,使其具有广泛应用的多功能工具。 This approach harnesses the image understanding capabilities of Anthropic’s Claude 3 model to extract information directly from photographs taken on-site, by analyzing the labels present in those field images.Solution overviewThe AI-powered asset inventory labeling solution aims to streamline the process of updating inventory databases by automatically extracting relevant information from asset labels through computer vision and generative AI capabilities.该解决方案使用各种AWS服务来创建一个端到端系统,使现场技术人员能够捕获标签图像,使用AI模型提取数据,验证准确性并无缝更新库存