利用并行性是在内存数据库引擎中执行低延迟的游戏的名称。最突出的是,现代通用CPU继续主导计算单元的领域,它通过两个面向数据的平行范式提供了高度计算的能力:MIMD和SIMD。不幸的是,由于两个平行范式都表现出不同的编程模型和内存访问模式,因此以组合方式利用这两种模型都是具有挑战性的。但是,CPU上SIMD的最新硬件进步放宽了对SIMD友好内存访问模式的限制。与纯线性访问模式的最新技术相比,替代访问模式的可用性和性能已显着提高。正如我们将在本文中所展示的那样,这些进步为统一的并行化方法铺平了道路,该方法以联合方式利用MIMD和SIMD,为有效的分析查询处理提供了一种新颖而有希望的方式。
摘要:在数据驱动的系统中,数据探索对于做出实时决策至关重要。但是,大数据存储在很难检索的大量数据库中。近似查询处理(AQP)是一种基于数据摘要(摘要)的汇总查询的近似答案的技术,该数据密切复制了实际数据的行为;当对查询的大概答案在实际执行时间的一小部分中可以接受时,这可能很有用。本研究探讨了生成对抗网络(GAN)的新利用,用于生成可以在AQP中用于概要构建中的表格数据。我们彻底研究了概要构建过程带来的独特挑战,包括维持数据分配特征,处理有限的连续和分类数据以及保持语义关系,然后我们介绍了克服这些挑战的表格GAN结构的进步。此外,我们提出并验证一套用于评估GAN生成概要的可靠性的统计指标。我们的发现表明,先进的GAN变化具有产生高保真概述的有前途的能力,有可能改变AQP在数据驱动系统中的效率和有效性。
雅各布大学,校园环路 12,28759 不来梅,德国,{d.misev,p.baumann}@jacobs-university.de A BSTRACT 数据立方体是分析和可视化时空数据产品的公认基石。通过从特定于提供商的组织中抽象出无数文件,可以提高用户友好度。数据立方体查询语言还建立了可操作的数据立方体,使用户能够“随时”进行任何查询,而无需编写任何代码。然而,通常数据立方体部署的目标是大规模数据中心环境,以适应大数据和大规模并行处理能力,从而实现良好的性能。在本文中,我们反过来报告了一项降尺度实验。在 ORBiDANSE 项目中,数据立方体引擎 rasdaman 已移植到立方体卫星 ESA OPS-SAT 上,并在太空中运行。实际上,卫星因此成为一种数据立方体服务,提供 OGC 网络覆盖处理 (WCPS) 地理数据立方体分析语言的基于标准的查询功能。我们相信,这将为机载临时处理和过滤地球大气大数据铺平道路,从而在更短的时间内将其发布给更大的受众。 论文类型和关键词 简短交流:数据立方体、立方体卫星、卫星、阵列数据库、rasdaman、SQL/MDA 1 引言 获取大量地球观测卫星图像从未如此便宜,这有助于监测和了解我们的星球及其随时间的演变。同时,这也带来了许多挑战 [19]。
宣誓书 .................................................................................................................... 2