数据库传统上查询在封闭世界中运行,对超出数据库中存储的数据之外的问题的问题没有提供任何答案。使用SQL的混合查询通过将关系数据库与大型语言模型(LLMS)集成在一起以回答超越数据库问题,从而提供了替代方案。在本文中,我们介绍了第一个跨域基准,天鹅,其中包含120个超越数据库问题的问题。为了利用最新的语言模型来解决天鹅中的这些复杂问题,我们提出了两个解决方案:一个基于模式扩展,另一个基于用户定义的功能。我们还讨论优化机会和潜在的未来方向。我们的评估表明,使用GPT-4 Turbo几乎没有提示,可以实现高达40.0%的执行准确性,而数据事实可达到48.2%。这些结果突出了混合查询的潜力和挑战。我们认为,我们的工作将激发进一步的研究,以创建更有效,更准确的数据系统,这些数据系统无缝整合关系数据库和大型语言模型,以解决超越数据库问题。