摘要。在过去几年中,数据湖的概念已成为数据存储和分析的时尚。因此,已经提出了几种方法来构建数据湖系统。但是,由于没有通常的共享标准来比较数据湖系统,因此很难评估此类建议。因此,我们在本文中介绍了DLBench+,这是一种评估和比较支持文本和/或表格内容的数据湖实现的基准。更具体地说,我们提出了一个由文本和CSV文档制成的数据模型,该模型是由一组各种任务组成的工作负载模型以及一组基于绩效的指标,所有这些指标都与数据湖的上下文有关。除了纯粹的定量评估之外,我们还提出了一种方法,以通过评估用户体验来定性评估数据湖系统。作为概念证明,我们使用dlbench+评估我们开发的开源数据湖系统。