使用LLMS生成SQL生成的企业级自然语言:平衡准确性,延迟和规模

在这篇文章中,AWS和Cisco团队推出了一种解决企业级SQL生成挑战的新方法。团队能够降低NL2SQL流程的复杂性,同时提供更高的准确性和更好的整体性能。

来源:亚马逊云科技 _机器学习
此博客文章与Cisco.enterprise数据的Renuka Kumar和Thomas Matthew共同撰写,其性质涵盖了各种数据域,例如安全,财务,产品和HR。这些域之间的数据通常是在不同的数据环境(例如Amazon Aurora,Oracle和Teradata)之间维护的,每个数据都管理数百个或数千个表来表示和坚持业务数据。这些表设置复杂的领域特定模式,并具有嵌套表和多维数据的实例,这些数据需要复杂的数据库查询和针对数据检索的特定领域知识。生成AI的进步已导致自然语言对SQL(NL2SQL)技术的快速发展,这些技术使用了PREANSIRE MIRM MINES DATAIRE和自然的大型语言(LLMS)。尽管这项技术有望简单和易于使用数据访问,但是将自然语言查询以准确性和企业量表转换为复杂的数据库查询仍然是一个重大挑战。对于企业数据,一个主要的困难源于具有嵌入式结构的数据库表的常见情况,这些结构需要特定的知识或高度细微的处理(例如,嵌入式XML格式化的字符串)。结果,企业数据的NL2SQL解决方案通常不完整或不准确。本文描述了AWS和Cisco团队已经开发和部署的模式,可以在大规模上可行,并解决了一系列挑战性的企业用途案例。该方法可以通过减少SQL生成所需的处理来使用更简单,更具成本效益和较低的潜伏期。针对NL2SQL用例的企业尺度NL2SQLGenerative的特定挑战至关重要; SQL查询不准确可能导致敏感的企业数据泄漏,或导致影响关键业务决策的结果不准确。企业规模数据提出了特定的挑战