Apoidea组如何使用亚马逊Sagemaker Hyperpod上使用Llama-Factory从银行文档中提取视觉信息

在这个专业信息提取解决方案的基础上建立了建立,并利用Sagemaker Hyperpod的功能,我们与Apoidea Group合作探索了使用大型视觉语言模型(LVLM)的使用,以进一步改善银行和财务文档上的表结构识别性能。在这篇文章中,我们介绍了使用Sagemaker Hyperpod上的Llama-Factory进行QWEN2-VL-7B教学模型进行微调的QWEN2-VL-7B教学模型的逐步代码。

来源:亚马逊云科技 _机器学习
这篇文章与Apoidea Group的Ken Tsui,Edward Tsoi和Mickey Yip共同撰写。银行业长期以来一直在与重复过程(例如信息提取,文档审查和审计)相关的效率低下。这些任务需要大量的人力资源,减慢了关键操作,例如了解您的客户(KYC)程序,贷款申请和信用分析。结果,银行面临运营挑战,包括有限的可扩展性,缓慢的处理速度以及与员工培训和营业额相关的高成本。要解决这些效率低下,实施高级信息提取系统至关重要。这些系统可以从各种财务文件中快速提取数据(包括银行对帐单,KYC表格和贷款应用程序),还降低了手动错误和处理时间。因此,信息提取技术有助于加速客户入门,维持监管合规性并推动银行业的数字化转型,尤其是在大量文档处理任务中,文档处理中的挑战却加剧了对高准确的解决方案的需求,这些解决方案需要保持高准确性,同时处理敏感的金融数据,例如处理敏感的金融数据,例如财务数据,财务状况,一年一度的财务状况和公司年度报告。这是位于香港的以AI为重点的Indepent Indepention Software供应商(ISV)的Apoidea Group产生了重大影响。通过使用尖端的生成AI和深度学习技术,Apoidea开发了创新的AI驱动解决方案,以满足跨国银行的独特需求。他们的旗舰产品SuperACC是一项复杂的文档处理服务,具有一系列专有的文档理解模型,能够处理各种文档类型,例如银行对帐单,财务报表和KYC Documents.SuperACC。