几十年来,地下成像对 HPC 提出了越来越高的要求,例如数据量不断增加、密度和分辨率更高、模型保真度更高以及持续的升级周期。因此,CGG 已成为能源行业最大的 HPC 用户。它满足了自身运营不断变化的需求,并托管了外部客户数据,为客户提供安全访问以查看进度和协作。
摘要:全球每年生产的数字数据量正在越来越多。估计表明,到2025年,我们将达到175个全球创建的数字数据的Zettabytes。尽管今天在存储设备上取得了进步,但当前的数据库管理系统无法应对这些数据量。除了最近的存储技术方面的改进,还需要达到生成数据的不断增长。考虑到当前的存储技术(例如HDD和Tape)需要每隔几年更换时,就会进一步夸大此问题。为了应对这种缺陷,脱氧核糖核酸(DNA)提供了一种新颖的耐用(千年尺度),极度致密和能效的储存培养基。但是,当前的DNA系统缺乏对随机访问的支持,除了键值查找之外,还缺乏表达性查询支持。在本文中,我们提出了DNACONTAINER,这是DNA上的一种新型存储架构,它跨越了物体上的大量虚拟地址空间,从而使随机访问DNA大规模访问DNA,同时遵守所需的生化约束。DNACONTAINER的接口还促进了常见的外部数据结构的实现,例如数组和列表将数据存储在固定大小的块中。
图 2:元数据和数据的层级及其大致的字节数(左轴)。作为研究过程的一部分,获取的数据会被过滤、分析和提炼。这通常会产生越来越小但价值更高的数据集。由于预期的数据量,无法保证所有数据的可用性级别相同。因此,数据被分为四个层级,可用性级别不同,从完全不共享(层 0)到使用 DOI 发布(层 3)。
项目:由于大型调查(例如ESA Mission Gaia)的数据量成倍增长,天文学正在进入大数据科学的新时代。这些数据的非凡量大大超过了人类的发现能力。因此,利用机器学习(ML)技术可以提供利用大型数据集所需的准确性和自动化,这是非常需要的。在此项目中,我们将各种ML算法应用于Gaia数据,以:
1将钥匙插入钥匙插槽中。编程作业会自动启动。Ö数据已编程为密钥。编程过程可能需要几分钟,具体取决于数据量。在此期间,三个LED闪烁白色。Ö完成编程任务已成功完成时,两个升高的声学信号声音,三个LED熄灭,并且显示器亮起了绿色。2卸下钥匙。
2。运行匕首并报告您先前使用行为克隆(即ANT +另一个环境)测试的两个任务。以学习曲线的形式报告您的结果,绘制匕首迭代的数量与策略的平均收益,并显示出错误栏以显示标准偏差。在同一地块上包括专家策略的性能和行为克隆代理(如遍布图的水平线)。在标题中,说明您使用的任务以及有关网络体系结构,数据量等的任何详细信息。(如上一节所示)。
注意:Agile ECP 表单上的许多块的字符长度有限,因此限制了可以输入的数据量。(ECP 表单中添加了字符计数器(图 7)。)如果文本太长,则需要使用附件才能包含 ECP 中的所有信息。附件 A(附加信息)用于此目的。本文档的附录 D 中包含了附件 A 模板的示例。附件 A 的模板也可以在 Agile 中此 WPI 表单的附件选项卡上找到。