雅各布大学,校园环路 12,28759 不来梅,德国,{d.misev,p.baumann}@jacobs-university.de A BSTRACT 数据立方体是分析和可视化时空数据产品的公认基石。通过从特定于提供商的组织中抽象出无数文件,可以提高用户友好度。数据立方体查询语言还建立了可操作的数据立方体,使用户能够“随时”进行任何查询,而无需编写任何代码。然而,通常数据立方体部署的目标是大规模数据中心环境,以适应大数据和大规模并行处理能力,从而实现良好的性能。在本文中,我们反过来报告了一项降尺度实验。在 ORBiDANSE 项目中,数据立方体引擎 rasdaman 已移植到立方体卫星 ESA OPS-SAT 上,并在太空中运行。实际上,卫星因此成为一种数据立方体服务,提供 OGC 网络覆盖处理 (WCPS) 地理数据立方体分析语言的基于标准的查询功能。我们相信,这将为机载临时处理和过滤地球大气大数据铺平道路,从而在更短的时间内将其发布给更大的受众。 论文类型和关键词 简短交流:数据立方体、立方体卫星、卫星、阵列数据库、rasdaman、SQL/MDA 1 引言 获取大量地球观测卫星图像从未如此便宜,这有助于监测和了解我们的星球及其随时间的演变。同时,这也带来了许多挑战 [19]。
宣誓书 .................................................................................................................... 2
利用并行性是在内存数据库引擎中执行低延迟的游戏的名称。最突出的是,现代通用CPU继续主导计算单元的领域,它通过两个面向数据的平行范式提供了高度计算的能力:MIMD和SIMD。不幸的是,由于两个平行范式都表现出不同的编程模型和内存访问模式,因此以组合方式利用这两种模型都是具有挑战性的。但是,CPU上SIMD的最新硬件进步放宽了对SIMD友好内存访问模式的限制。与纯线性访问模式的最新技术相比,替代访问模式的可用性和性能已显着提高。正如我们将在本文中所展示的那样,这些进步为统一的并行化方法铺平了道路,该方法以联合方式利用MIMD和SIMD,为有效的分析查询处理提供了一种新颖而有希望的方式。
摘要:在数据驱动的系统中,数据探索对于做出实时决策至关重要。但是,大数据存储在很难检索的大量数据库中。近似查询处理(AQP)是一种基于数据摘要(摘要)的汇总查询的近似答案的技术,该数据密切复制了实际数据的行为;当对查询的大概答案在实际执行时间的一小部分中可以接受时,这可能很有用。本研究探讨了生成对抗网络(GAN)的新利用,用于生成可以在AQP中用于概要构建中的表格数据。我们彻底研究了概要构建过程带来的独特挑战,包括维持数据分配特征,处理有限的连续和分类数据以及保持语义关系,然后我们介绍了克服这些挑战的表格GAN结构的进步。此外,我们提出并验证一套用于评估GAN生成概要的可靠性的统计指标。我们的发现表明,先进的GAN变化具有产生高保真概述的有前途的能力,有可能改变AQP在数据驱动系统中的效率和有效性。
•分数:MMLU的90.8%,MMLU-PRO的84.0%,GPQA钻石的71.5%。•胜过DeepSeek-v3,但尾随OpenAI-O1-1217。•与其他封闭式模型相比,教育任务擅长于教育任务。SimpleQA:胜过DeepSeek-V3,展示了强大的事实查询处理。
摘要 我们提出了一个流数据处理框架,该框架将流数据库服务器作为基本组件。服务器充当分布式数据流源阵列与访问和分析流的最终用户客户端之间的流控制过滤器。底层框架提供新颖的流管理和查询处理机制,以支持在线获取、管理、存储、非阻塞查询。和分布式多传感器网络的数据流集成。在本文中,我们为流数据库定义了 OUT 流模型和流表示,并描述了流处理框架关键组件的功能和实现,包括源流的查询处理接口、流管理器、流缓冲区管理器、非阻塞查询执行,以及一类用于连接受滑动时间窗口约束的多个数据流的新连接算法。我们使用真实数据流进行实验,以评估新算法相对于传统流连接算法的性能。实验显示了显着的性能改进,也证明了我们的系统在处理数据流方面的灵活性。介绍了一种用于智能检测危险材料的多传感器网络应用程序,以说明我们框架的功能。
3-4 人小组的学生将阅读研究论文,其中利用索引构建、查询处理、容错检索、向量空间建模、概率信息检索、链接分析等信息检索方法来解决研究相关问题。学生将使用从 Kaggle、Github、UCI、KDD 等平台获取的标准数据集来实现研究论文。将这些方法应用于标准数据集将使学生能够增强对信息检索的理解和技能。
摘要 我们提出了一个流数据处理框架,该框架将流数据库服务器作为基本组件。服务器充当分布式数据流源阵列与访问和分析流的最终用户客户端之间的流控制过滤器。底层框架提供了新颖的流管理和查询处理机制,以支持分布式多传感器网络的在线获取、管理、存储、非阻塞查询和数据流集成。在本文中,我们为流数据库定义了 OUT 流模型和流表示,并描述了流处理框架关键组件的功能和实现,包括源流的查询处理接口、流管理器、流缓冲区管理器、非阻塞查询执行以及一类用于连接受滑动时间窗口约束的多个数据流的新连接算法。我们使用真实数据流进行实验,以评估新算法与传统流连接算法的性能。实验表明性能显著提高,同时也证明了我们的系统在处理数据流方面的灵活性。我们介绍了一种用于智能检测危险材料的多传感器网络应用,以说明我们框架的功能。
2在机器人技术中进行导航,映射和语义理解5 2.1概述。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。5 2.2基于GSPLAT的导航和映射。。。。。。。。。。。。。。。。。。。。。。。。。6 2.2.1基于GSPLAT的导航。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 2.2.2基于GSPLAT的映射。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。11 2.3语义理解和知识检索在GSPLAT环境中。。。。。11 2.3.1图像分割和嵌入。。。。。。。。。。。。。。。。。。。。。。12 2.3.2矢量数据库查找。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 2.3.3自然语言查询处理。。。。。。。。。。。。。。。。。。。。。。。14 2.3.4与导航和映射集成。。。。。。。。。。。。。。。。。。。14
AI购物助理,将GPT-4,AHP和YOLO V11结合在一起,以根据用户需求和购买方式来查询处理,产品排名,库存检测以及自动购买。我的贡献:作为团队的一部分,我使用OpenAI API与GPT-4开发了搜索机器人,以搜索/排名和基于用户输入的语义推理。(github)技术堆栈:python,pandas,numpy,ahp,yolo v11,openai api,gpt-4o,react,react,next.js,fastapi